Archivo para Junio, 2009
Jueves, Junio 25th, 2009
Hace unos días conversábamos Raúl y yo sobre árboles de clasificación. En particular, hablábamos de CART, el algoritmo propietario de Salford Systems. Me intrigó saber cuál sería la diferencia entre dicho algoritmo y la alternativa existente en R, rpart.
El autor de dicho paquete, Terry Therneau, tuvo la gentileza de ofrecer ...
Publicado en Data Mining, Modelos, R | 9 Comentarios »
Jueves, Junio 18th, 2009
Desde hace apenas unas semanas existe una lista de correo de ayuda en español para R. Está gestionada desde los servidores de CRAN.
Para darse de alta en ella sólo hay que seguir las instrucciones contenidas en el siguiente enlace:
https://stat.ethz.ch/mailman/listinfo/r-help-es
Los usuarios de R están más que invitados a participar en ella ...
Publicado en R | 1 Comentario »
Lunes, Junio 15th, 2009
Hace varios días planteamos algún truco SAS para la realización de muestras aleatorias. Hoy planteo otro truco para lo mismo pero empleando el procedimiento de SAS SURVEYSELECT. Este procedimiento lo tenemos en el módulo STAT y tiene una sintaxis muy sencilla. Además nos permite realizar muestreos estratificados de forma muy ...
Publicado en Formación, SAS, Trucos | 1 Comentario »
Viernes, Junio 12th, 2009
Para trabajar directamente con el motor de BBDD SAS cuenta con "Pass trougth". SAS crea una conexión al gestor de BBDD y desde ese momento podemos ejecutar sentencias de SQL directamente. Para seguir con la línea de trabajo habitual emplearemos ejemplos para conocer su funcionamiento. Los ejemplos que vamos a ...
Publicado en Business Intelligence, Formación, SAS | 3 Comentarios »
Martes, Junio 9th, 2009
Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:
rpart, tal vez mi favorito
RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R
mvpart
party
Cada uno de ellos ...
Publicado en Data Mining, R | 2 Comentarios »
Lunes, Junio 8th, 2009
Ante el exito de los mensajes dedicados al análisis cluster la nueva entrega del manual de R la dedicaremos de nuevo al análisis de agrupamiento. Como es habitual trabajaremos con un ejemplo que podéis desgargaros aquí. Partimos de un archivo de texto delimitado por tabuladores con 46 frutas y la ...
Publicado en Formación, Modelos, R | 6 Comentarios »
Viernes, Junio 5th, 2009
El otro día me preguntó una amiga estadística qué herramienta visual de minería de datos libre —imagino que también quería decir gratuita— le recomendaba. Pensaba que la respuesta a la pregunta era sobradamente conocida de los que nos movemos en nuestro estrecho mundillo. La constatación —sobre una muestra que he ...
Publicado en Data Mining | No hay Comentarios »
Jueves, Junio 4th, 2009
Recientemente, hubo una entrada en este blog sobre cómo realizar muestreos aleatorios en tablas SAS. En ésta vamos a ver cómo se procedería con R.
Consideraremos el conjunto de datos iris —de dimensión 150 x 5— y extraeremos 60 filas con distintos procedimientos.
Para el muestreo aleatorio simple sin repetición, basta con ...
Publicado en Formación, R, Trucos | No hay Comentarios »
Miércoles, Junio 3rd, 2009
Recientemente se publicó en este blog una entrada haciendo mención a la futura integración de R en SAS. Existe, de hecho, un procedimiento artesanal de lanzar procesos de R desde SAS basado en la posibilidad de realizar llamadas al sistema operativo desde SAS. No obstante, SAS ha decidido ahondar en ...
Publicado en R, SAS | No hay Comentarios »
Miércoles, Junio 3rd, 2009
Llega un gran número de visitas a AyD buscando como transformar en SAS variables caracter a numéricas y viceversa. Pero estas visitas están muy poco tiempo y me he planteado que los mensajes que hay dedicados al uso de PUT e INPUT no son claros. Por este motivo planteo un ...
Publicado en Formación, SAS, Trucos | No hay Comentarios »