El kettle no sólo puede servirnos para subir y bajar tablas a nuestra BBDD. También puede ayudarnos a describir las tablas de nuestras BBDD de una forma muy sencilla. El paso Univariate Statistics será nuestro aliado para esta sencilla tarea.
Lo primero que tenemos que hacer es crear una conexión a nuestra BBDD. Hace tiempo ya hablamos de esta labor con Postgres. Una vez creada la conexión comprobamos su correcto funcionamiento y el primer paso será una Entrada Tabla donde seleccionaremos la tabla que deseamos describir:
El botón Obtener consulta SQL nos permite navegar de forma sencilla por los distintos esquemas de la BBDD, seleccionamos la tabla y podemos ver la consulta a realizar, por supuesto podemos manipular el código SQL a nuestro antojo. Como siguiente elemento vamos a utilizar Sample Rows de la carpeta Statistics para seleccionar sólo una muestra y que nuestro proceso sea menos pesado. El siguiente paso es el Univariate Statistic donde seleccionaremos los campos que deseamos sumarizar y el análisis deseado:
En este caso seleccionamos 3 campos para los que obtenemos la frecuencia, la media y la desviación típica. Por último la salida de este análisis la vamos a llevar a Excel, para ello tenemos el paso Salida Excel. Un paso muy sencillo donde tenemos una gran cantidad de posibilidades:
Muy fácil. A qué esperas para tener el kettle en tu equipo.