Archivo de la etiqueta: postgres

Montemos un sistema de información en nuestro equipo (III)

Vamos a conectar R a nuestra BBDD postgres. Lo vamos a hacer vía ODBC con el paquete de R RODBC [inciso] recordad que todo el trabajo lo estamos realizando bajo Win. Además trabajar con ODBC nos permitirá conectar nuestro postgres con Access o Excel. Aunque para este tipo de tarea recomiendo el uso del Data Integration de Pentaho. El primer paso será descargarnos de esta dirección los controladores ODBC para Postgres que se adecúen con nuestro S.O. y nuestra versión de postgres. Tras instalarlos ya podemos ir a las Herramientas Administrativas Orígenes de Datos ODBC e introducimos un nuevo DSN de sistema y de usuario:

sinfo_casero7.png

Ya tenemos un origen de datos ODBC para nuestra BBDD de postgres llamado PostgreSQL30. Podemos crear la conexión con R:

library(RODBC)
con = odbcConnect("PostgreSQL30",case="postgresql")

Ya tenemos conectado R con nuestra BBDD y podemos realizar consultas sobre ella:

datos = sqlQuery(con,"SELECT * FROM red_wine")

Seleccionamos todos los campos de la tabla red_wine que cargamos en el capítulo anterior del monográfico. También estamos en disposición de subir a nuestro postgres los objetos de R que deseemos:

#Creamos una muestra aleatoria de 100 registros
selec = sample(1:nrow(datos),100)
muestra = datos[selec,]
#Subimos a la BBDD postgres el data frame de R
sqlSave(con,muestra)

Vemos que la función sqlSave nos permite guardar en la BBDD aquellos objetos de R que consideremos necesarios. En pocos pasos estamos construyendo herramientas para que nuestro equipo tenga un pequeño sistema de información. Este sistema se sustenta en tre pilares fundamentales: Postgres, Data Integration de Pentaho y R. Software libre.

Montemos un sistema de información en nuestro equipo (II)

Vamos a empezar a subir archivos a la BBDD. Evidentemente lo primero que tenemos que hacer es crearnos una BBDD en Postgres. Con el PGAdmin creamos una nueva base de datos, disponemos de varias opciones, en nuestro caso no modificamos ninguna y creamos BD. Ya tenemos una BBDD funcionando y a la hora de conectarnos a ella tendremos que asignarle las propiedades necesarias para su correcto funcionamiento:

postgres-1.png

Ya tenemos dispuesta la BBDD y ya podemos empezar a subir tablas. Para ello ya os comenté que usaríamos el Data Integration de Pentaho (antes conocido como Kettle). La intención que tengo al montar este pequeño sistema de información es disponer de una serie de tablas para la realización de modelos estadísticos con R. Podría tener mi equipo lleno de ficheros de texto, de Excel y algún Access por ahí pero es eso lo que pretendo evitar, con esto me garantizo un orden y un correcto acceso a mis tablas. Para comenzar a trabajar quiero subir una tabla del repositorio de datos UCI Quiero seguir trabajando con el paquete e1071 de R Seguir leyendo Montemos un sistema de información en nuestro equipo (II)

Montemos un sistema de información en nuestro equipo (I)

Un poco de bricolaje. Se trata de crear un sistema de información sin coste y que nos permita almacenar nuestros datos con orden y coherencia, crear informes y realizar modelos matemáticos bajo Windows. Es perfectamente replicable para Linux. También estoy abierto a sugerencias ya que tampoco soy ningún experto en el tema y podemos crear un debate interesante. El sistema que planteo se va  a sustentar en 3 pilares fundamentales que os podéis descargar de forma gratuita en los link creados:

  • Postgres:
  • Será nuestro motor de BBDD relacionales. Seguramente no haremos un modelo de datos complicado e incluso nos dedicaremos a llenar la BBDD con tablas de todo tipo sin mucha conexión entre ellas pero es necesario tener una BBDD.

  • Data integration de Pentaho:
  • Será la herramienta que empleemos para subir datos al servidor. También podremos emplearla para realizar informes.

  • R:
  • Que puedo más puedo decir sobre R. El futuro.

Para la realización de informes he comentado la posibilidad de emplear Pentaho pero puede ser más adecuado emplear una hoja de cálculo. Para esto yo si me gasté dinero y dispongo de Excel, pero intentaré trabajar con Google Spreadsheet. El primer paso es descargarse cada una de las herramientas que propongo. Tanto Postgres como R nos lo descargamos y lo instalamos, el Data Integration de Pentaho no requiere instalación, nos descargamos el archivo, lo descomprimimos y para arrancarlo tenemos el script spoon.bat R no plantea muchos problemas para instalarse en un equipo local de Windows y Postgres puede dar algún problema en Windows 7, si alguien los tiene que los reporte para ayudar a solventarlos y así quedan documentados en el blog. La instalación dePostgres nos pedirá la contraseña del admin, ojo con esta contraseña.

En la siguiente entrega comenzaremos a trabajar con Postgres y Pentaho. Por supuesto, como he comentado antes, cualquier aporte será bienvenido. Saludos