Archivo para la categoría ‘Data Mining’
Martes, Enero 10th, 2012
Interesante iniciativa de Juanjo Gibaja y Carlos Gil Bellosta consistente en leer el libro “The Elements of Statistical Learning”. La idea es crear un grupo de trabajo que lea de forma coordinada el libro, pero además van a implementar en R los ejercicios y ejemplos. Desde esta bitácora no vamos ...
Publicado en Data Mining, Formación, Modelos, R | No hay Comentarios »
Domingo, Noviembre 6th, 2011
El sobremuestreo (oversampling) es una técnica de muestreo que se emplea habitualmente cuando tenemos una baja proporción de casos positivos en clasificaciones binomiales. Los modelos pueden “despreciar” los casos positivos por ser muy pocos y nuestro modelo no funcionaría. Para incrementar el número de casos positivos se emplea el sobremuestreo. ...
Publicado en Data Mining, Formación, Modelos, Monográficos, R | 4 Comentarios »
Martes, Julio 12th, 2011
Con SAS Base podemos hacer árboles de decisión porque tenemos R. Así de sencillo. Vamos a utilizar SAS para gestionar nuestros datos y R será la herramienta que utilicemos para la realización del modelo de árbol de decisión. Posteriormente emplearemos las reglas generadas por el modelo para etiquetar a nuestros ...
Publicado en Data Mining, Formación, Modelos, Monográficos, R, SAS, WPS | No hay Comentarios »
Viernes, Junio 10th, 2011
Vuelvo hoy con el uso de rpart para la creación de árboles de decisión con R. Pero hoy, además de realizar un modelo de árbol con R quiero presentaros una función que nos permite guardar las reglas generadas con nuestro modelo en un fichero de texto para su posterior utilización ...
Publicado en Data Mining, Formación, Modelos, R, SAS, Trucos | No hay Comentarios »
Viernes, Febrero 4th, 2011
¿Qué hacen los políticos españoles en el Congreso de los Diputados? Las tertulias radiofónicas están llenas de analístas políticos que podrán opinar sobre la labor del Congreso mejor que yo. Sin embargo yo tengo WPS, sé programar en SAS y en la web del Congreso están todas las sesiones y ...
Publicado en Business Intelligence, Data Mining, Formación, Monográficos, SAS, WPS | 6 Comentarios »
Domingo, Enero 30th, 2011
Me sigo durmiendo con el genio Juan Antonio Cebrián y sus pasajes de la historia, monográficos zona cero o tertulias 4 C. Sus programas de radio me acompañan desde hace muchos años. Estudiando, vigilando instalaciones del ejercito o en el turno de noche de una fábrica Cebrián y su gente ...
Publicado en Data Mining, Modelos, R | 2 Comentarios »
Jueves, Enero 13th, 2011
¿Curva ROC y Excel? ¡Si no tiene nada que ver! No del todo. En ocasiones tenemos que pintar las curvas ROC y empleamos las herramientas específicas para ello, sin embargo es habitual que nuestros resultados sean presentados en Excel (demasiado habitual). En ese caso creamos nuestros datos para llevarlos a ...
Publicado en Consultoría, Data Mining, Excel, Modelos, Monográficos | 6 Comentarios »
Sábado, Enero 8th, 2011
¿Qué variables son las más importantes para nuestro modelo de clasificación? Yo creo que muchos de vosotros os habréis encontrado con esta problemática. Hay muchas formas de solventarla, habitualmente empleamos aquellas variables que mejor pueden entender nuestras áreas de negocio. Es decir, hacemos segmentaciones en base al sexo y la ...
Publicado en Data Mining, Formación, Modelos, R | 14 Comentarios »
Miércoles, Julio 28th, 2010
Cuando realizamos modelos hay 3 conjuntos de datos fundamentales:
Conjunto de datos de entrenamiento: son los datos que entrenan los modelos
Conjunto de datos de validación: selecciona el mejor de los modelos entrenados
Conjunto de datos de test: Nos ofrece el error real cometido con el modelo seleccionado
Para entender mejor su importancia y ...
Publicado en Data Mining, Formación, Modelos | 3 Comentarios »
Martes, Junio 29th, 2010
El PROC KDE de SAS está incluido en el módulo SAS/STAT. Es un procedimiento que nos permite estudiar gráficamente las distribuciones de variables continuas. Lo que nos produce son gráficos de densidades. Para seguir el ejemplo nos vamos a ir a Yahoo Finance y descargarnos un evolutivo del IBEX de ...
Publicado en Data Mining, Formación, SAS | 4 Comentarios »