Domingo, Noviembre 6th, 2011
El sobremuestreo (oversampling) es una técnica de muestreo que se emplea habitualmente cuando tenemos una baja proporción de casos positivos en clasificaciones binomiales. Los modelos pueden “despreciar” los casos positivos por ser muy pocos y nuestro modelo no funcionaría. Para incrementar el número de casos positivos se emplea el sobremuestreo. ...
Publicado en Data Mining, Formación, Modelos, Monográficos, R | 4 Comentarios »
Martes, Julio 12th, 2011
Con SAS Base podemos hacer árboles de decisión porque tenemos R. Así de sencillo. Vamos a utilizar SAS para gestionar nuestros datos y R será la herramienta que utilicemos para la realización del modelo de árbol de decisión. Posteriormente emplearemos las reglas generadas por el modelo para etiquetar a nuestros ...
Publicado en Data Mining, Formación, Modelos, Monográficos, R, SAS, WPS | No hay Comentarios »
Viernes, Junio 10th, 2011
Vuelvo hoy con el uso de rpart para la creación de árboles de decisión con R. Pero hoy, además de realizar un modelo de árbol con R quiero presentaros una función que nos permite guardar las reglas generadas con nuestro modelo en un fichero de texto para su posterior utilización ...
Publicado en Data Mining, Formación, Modelos, R, SAS, Trucos | No hay Comentarios »
Sábado, Enero 9th, 2010
Los árboles de clasificación son una de las técnicas de análisis más utilizadas. No requieren supuestos distribucionales, permite detectar interacciones entre variables y no es muy sensible a la presencia de valores perdidos y outliers. En resumen, es una técnica que no quita mucho tiempo al analista para hacer ...
Publicado en Data Mining, Formación, Modelos, R | 5 Comentarios »
Jueves, Junio 25th, 2009
Hace unos días conversábamos Raúl y yo sobre árboles de clasificación. En particular, hablábamos de CART, el algoritmo propietario de Salford Systems. Me intrigó saber cuál sería la diferencia entre dicho algoritmo y la alternativa existente en R, rpart.
El autor de dicho paquete, Terry Therneau, tuvo la gentileza de ofrecer ...
Publicado en Data Mining, Modelos, R | 10 Comentarios »