Montemos un sistema de información en nuestro equipo (I)

Un poco de bricolaje. Se trata de crear un sistema de información sin coste y que nos permita almacenar nuestros datos con orden y coherencia, crear informes y realizar modelos matemáticos bajo Windows. Es perfectamente replicable para Linux. También estoy abierto a sugerencias ya que tampoco soy ningún experto en el tema y podemos crear un debate interesante. El sistema que planteo se va  a sustentar en 3 pilares fundamentales que os podéis descargar de forma gratuita en los link creados:

  • Postgres:
  • Será nuestro motor de BBDD relacionales. Seguramente no haremos un modelo de datos complicado e incluso nos dedicaremos a llenar la BBDD con tablas de todo tipo sin mucha conexión entre ellas pero es necesario tener una BBDD.

  • Data integration de Pentaho:
  • Será la herramienta que empleemos para subir datos al servidor. También podremos emplearla para realizar informes.

  • R:
  • Que puedo más puedo decir sobre R. El futuro.

Para la realización de informes he comentado la posibilidad de emplear Pentaho pero puede ser más adecuado emplear una hoja de cálculo. Para esto yo si me gasté dinero y dispongo de Excel, pero intentaré trabajar con Google Spreadsheet. El primer paso es descargarse cada una de las herramientas que propongo. Tanto Postgres como R nos lo descargamos y lo instalamos, el Data Integration de Pentaho no requiere instalación, nos descargamos el archivo, lo descomprimimos y para arrancarlo tenemos el script spoon.bat R no plantea muchos problemas para instalarse en un equipo local de Windows y Postgres puede dar algún problema en Windows 7, si alguien los tiene que los reporte para ayudar a solventarlos y así quedan documentados en el blog. La instalación dePostgres nos pedirá la contraseña del admin, ojo con esta contraseña.

En la siguiente entrega comenzaremos a trabajar con Postgres y Pentaho. Por supuesto, como he comentado antes, cualquier aporte será bienvenido. Saludos

7 comentarios en “Montemos un sistema de información en nuestro equipo (I)

  1. Hummm… ¡me suena eso!

    Y es una excelente manera de comenzar. Pentaho Data Integration, antes Kettle, es una herramienta bastante útil y de ello dan fe las experiencias que tuvimos incluso en everis.

    ¡Suerte con todo ello y que no te muerda ningún dinosaurio!

  2. Sin ánimo de desencadenar una guerra santa contra el infiel, ¿algún motivo en especial para sugerir Postgres sobre otras opciones como MySQL?
    ¡Gracias!

  3. Que buena pregunta Guillermo. La verdad es que mis “miedos” contra el MySQL son irracionales. Quizá sea porque no entiendo que hace el MySQL con el WordPress que sirve para realizar este blog, pero no puedo darte una razón coherente. Es evidente que nos sirve tanto Postgres como MySQL para montarnos una BBDD para nuestros datos y nuestros experimentos. Por Access si que no paso.

    Carlos, algo bueno si hicisteis por mi. Postgres y Pentaho son el “utilitario” (recuerdas) de los sistemas de la información. Antes no veía más allá de Oracle ahora soy capaz de proponer a algún director que trabaje con HBase.

  4. Yo soy nuevo en el tema, pero se ve bastante interesante. Me quedo en espera para el siguiente post (bueno investigaré que es Pentaho).

    Saludos.

  5. Algunas gotas de Perl o Python para el procesado de datos nunca viene mal, por buena que sea la herramienta de Pentaho.
    Para los informes una opción muy interesante son Sweave y OdfSweave desde R.

  6. Yo no dejaría de lado SQLite como base de datos, que además de rápida, tiene la facilidad de que las tablas y demás se almacenan en un único fichero que se puede pasar de un usuario a otro. Yo he trabajado con bases de datos de 4 gigas en SQLite y tan fresca y me las llevaba de un sitio a otro en un pen-drive. Además, desde R se puede acceder a las bases de datos directamente con RSQLite.

    Creo recordar que Pentaho la soportaba. Si no, existen drivers ODBC y JDBC (para los no Windoweros).

    Un saludo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *