Univariantes de campos de nuestra BBDD con kettle

12 Sep

El kettle no sólo puede servirnos para subir y bajar tablas a nuestra BBDD. También puede ayudarnos a describir las tablas de nuestras BBDD de una forma muy sencilla. El paso Univariate Statistics será nuestro aliado para esta sencilla tarea.

transfomacion_kettle.png

Lo primero que tenemos que hacer es crear una conexión a nuestra BBDD. Hace tiempo ya hablamos de esta labor con Postgres. Una vez creada la conexión comprobamos su correcto funcionamiento y el primer paso será una Entrada Tabla donde seleccionaremos la tabla que deseamos describir:

entrada_tabla_kettle.png

El botón Obtener consulta SQL nos permite navegar de forma sencilla por los distintos esquemas de la BBDD, seleccionamos la tabla y podemos ver la consulta a realizar, por supuesto podemos manipular el código SQL a nuestro antojo. Como siguiente elemento vamos a utilizar Sample Rows de la carpeta Statistics para seleccionar sólo una muestra y que nuestro proceso sea menos pesado. El siguiente paso es el Univariate Statistic donde seleccionaremos los campos que deseamos sumarizar y el análisis deseado:

univariate_statistic_kettle.png

En este caso seleccionamos 3 campos para los que obtenemos la frecuencia, la media y la desviación típica. Por último la salida de este análisis la vamos a llevar a Excel, para ello tenemos el paso Salida Excel. Un paso muy sencillo donde tenemos una gran cantidad de posibilidades:

salida_excel_kettle.png

Muy fácil. A qué esperas para tener el kettle en tu equipo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *