Archivo para la categoría ‘Data Mining’

Entrenamiento, validación y test

Miércoles, Julio 28th, 2010

Cuando realizamos modelos hay 3 conjuntos de datos fundamentales: Conjunto de datos de entrenamiento: son los datos que entrenan los modelos Conjunto de datos de validación: selecciona el mejor de los modelos entrenados Conjunto de datos de test: Nos ofrece el error real cometido con el modelo seleccionado Para entender mejor su importancia y ...

Gráficos de densidades con SAS y el PROC KDE

Martes, Junio 29th, 2010

El PROC KDE de SAS está incluido en el módulo SAS/STAT. Es un procedimiento que nos permite estudiar gráficamente las distribuciones de variables continuas. Lo que nos produce son gráficos de densidades. Para seguir el ejemplo nos vamos a ir a Yahoo Finance y descargarnos un evolutivo del IBEX de ...

Monográfico. Un poco de PROC LOGISTIC

Jueves, Junio 24th, 2010

El PROC LOGISTIC es un procedimiento de SAS que nos ha dado muchas satisfacciones a los dinosaurios como el ahora escribiente. La regresión logística es uno de los modelos de regresión más utilizados y es bien conocido por todos mis lectores (bastante más inteligentes que yo). El problema es muy ...

Monográfico. Clasificación con SVM en R

Martes, Junio 15th, 2010

Las máquinas de vectores de soporte, Support Vector Machines, SVM a partir de ahora, son un conjunto de técnicas estadísticas que nos permiten clasificar una población en función de la partición en subespacios de múltiples variables. Parte de la idea de dividir de forma lineal un conjunto de múltiples dimensiones. ...

Las cuentas claras.

Sábado, Mayo 22nd, 2010

Si hay alguna tarea o procedimiento indispensable y más repetitivo hasta la saciedad por excelencia a la hora de trabajar con bases de datos y tener que reportar alguna información por mínima que sea, esta es contar o contabilizar el número de casos (registros) que tenemos en total o en ...

Revolution Computing ahora es Revolution Analytics

Sábado, Mayo 8th, 2010

Sigue adelante este interesante proyecto: http://revolutionanalytics.com/news-events/news-room/2010/revolution-analytics-defines-the-future-of-predictive-analytics-with-r.php Norman Nie sigue trabajando.

Porque me gusta R

Lunes, Marzo 29th, 2010

En los últimos tiempos he hablado mucho y mal de R en los "ambientes". El problema de siempre puede terminar con la paciencia de cualquiera, la manipulación de datos con R cuando superamos un GB puede acabar con la paciencia de este viejo dinosaurio. Viejo por usado no por mi edad, ...

Lectura para el fin de semana

Viernes, Marzo 12th, 2010

Cada vez me caen mejor estos de Minequest y llevo un tiempo siguiendo el blog de Adventures in Consulting. Me voy a dar de comer a mi león.

Monográfico. Regresión logística con R

Viernes, Enero 29th, 2010

Por fin nos metemos con la regresión logística en R. Nos meteremos con WPS (si es posible). Los modelos de regresión logística son los más utilizados en las áreas en las que el ahora escribiente ha trabajado. ¿Por qué tiene tanto "éxito"? Porque es el mejor ejemplo de modelo de ...

Monográfico. Paquete de R NNET para modelos de redes neuronales

Martes, Enero 26th, 2010

Quiero introduciros a los modelos de redes neuronales con R, mas concretamente quiero acercaros al módulo nnet de R. Tenemos extensa literatura al respecto de las redes neuronales, personalmente considero de lectura obligatoria este link (y prácticamente toda la documentación de este profesor) El paquete nnet nos permite crear ...