Archivo para Abril, 2009

Manual. Curso introducción de R. Capítulo 15: Análisis Cluster con R (I)

Jueves, Abril 23rd, 2009

El proposito del análisis de conglomerados (cluster en terminología inglesa) es el agrupar las observaciones de forma que los datos sean muy homogéneos dentro de los grupos (mínima varianza) y que estos grupos sean lo más heterogéneos posible entre ellos (máxima varianza). De este modo obtenemos una clasificación de los ...

La medicina genómica y los modelos predictivos

Jueves, Abril 16th, 2009

Hace tiempo que tengo pendiente este tema más que interesante. El New York Times se ha hecho eco de esta noticia. Sin duda el análisis matemático puede ayudar a predecir la propensión de las personas a muchas enferemedades.  Un campo interesante. Preparo un artículo y entro más en profundidad en el ...

Entrevista a Jim Goodnight fundador de SAS

Martes, Abril 14th, 2009

Interesante entrevista a Jim Goodnight CEO y co-fundador de de SAS. A SAS no parece afectarle la crisis que están sufriendo los más importantes bancos del mundo. Se están adaptando a la nueva demanda de software para el fraude y riesgos crediticios. También están haciendo un guiño a la optimización ...

SAS investiga la tecnología de R

Domingo, Abril 12th, 2009

Sacado de http://www.decisionstats.com/ muy interesante: A SAS spokesperson has confirmed to this blog that they have invested in the R –Core project to help build next generation algorithms . The new R powered SAS would not be sold as licenses but would be hosted on Amazon EC 2, thus users pay ...

SAS Global Forum 2009

Domingo, Abril 12th, 2009

Ya tenéis disponibles los "paper" del SAS Global Forum 2009. Echadle un vistazo porque siempre merecen la pena. Por otro lado se creó un blog donde tenéis algunas entrevistas todo muy típico y tópico, al fin y al cabo se trata de vender las excelencias de esta herramienta tan cara. Pero ...

Trucos R. Leer de Excel vía RODBC

Domingo, Abril 12th, 2009

Un gran número de visitas que llegan a este sitio tienen que ver con la importación de datos. En este caso he encontrado en Youtube un video explicativo en el que nos indican de una forma muy sencilla como importar a R datos desde hojas Excel con el paquete RODBC: [youtube]http://www.youtube.com/watch?v=Hq0JmSnBX8I[/youtube] "Very ...

Macros SAS. Tramificar en función de una variable respuesta

Miércoles, Abril 8th, 2009

Sobre la idea de “dumificar” variables he ideado un proceso para agrupar variables cuantitativas en función de una variable respuesta. Los que disponéis de herramientas de análisis más complejas tipo Enterprise Miner o Clementine ya disponéis de algoritmos y funciones que realizan esta útil tarea, además los árboles pueden trabajar ...

Trucos SAS. Variables dummy de una variable continua

Lunes, Abril 6th, 2009

Dumificar es crear variables dummy. Un verbo completamente inventado pero que todos los que os habéis enfrentado a la creación de una tabla de entrada para realizar modelos estadísticos vais a entender perfectamente en que consiste. Dumificar es transformar una variable continua en N variables dicotómicas. Lo entenderemos mejor con ...