Archivo para la categoría ‘Data Mining’

El futuro de la profesión

Viernes, Enero 15th, 2010

Nuestra profesión, la del estadístico que trabaja en la industria o la consultoría, está sometida a los cambios que exige el nuevo siglo. Llevo meses clamando en vano frente a un público que no escucha mis advertencias de peligro de obsolescencia. Pero un anuncio de un puesto de trabajo en ...

Monografico. Arboles de decisión con party

Sábado, Enero 9th, 2010

Los árboles de clasificación son una de las técnicas de análisis más utilizadas. No requieren supuestos distribucionales, permite detectar interacciones entre variables y no es muy sensible a la presencia de valores perdidos y outliers. En resumen, es una técnica que no quita mucho tiempo al analista para hacer ...

Los mejores y más útiles trucos de R

Martes, Diciembre 29th, 2009

Como estamos medio de fiesta y da pareza poner en funcionamiento los engranajes del cerebro para producir ideas originales, me limitaré a apuntar un enlace en el que los usuarios han propuesto y votado sus mejores trucos de R. Para los más perezosos, indicaré que el campeón ha sido la función ...

Ibercivis, una plataforma de computación ciudadana

Jueves, Diciembre 17th, 2009

Creo que es hecho conocido que existe el proyecto SETI@home, una red de ordenadores que ceden voluntarios para analizar nosequé tipo de datos para la nosequé clase de esotéricos fines. Nunca me interesó el asunto en sí, aunque sí la plataforma. Más que el ser capaces de robarle el wifi a ...

Tres fracasos y medio con R

Martes, Diciembre 15th, 2009

Hoy, mientras Raúl departía en el cuarto de al lado —él os dirá por qué y para qué— y hacía tiempo para saludarlo, me he entretenido fracasando tres veces y media en lo que abajo desarrollo. No pensaba publicarlo hasta que, reflexionando, he considerado que, a veces, más útil es ...

Una fabulilla (sobre PRIM) con múltiples moralejas

Sábado, Diciembre 12th, 2009

–Érase una vez un banco... –¿Me cuenta Vd. un cuento? –Mismamente, señora. –¿Quiérese, pues, decir que cuanto Vd. relate es pura ficción, no pareciéndose ni las personas (físicas o jurídicas) ni los lances de su aún inaudita historia a personas (físicas o jurídicas, respectivamente) y lances reales, casualidades éstas que pudieran derivar, según ...

Traducir código SAS a Java

Sábado, Noviembre 14th, 2009

Hacía tiempo que no escribía en este blog pero creo que la noticia bien amerita un hiato en mi contumaz incuria. Dias ha, escribí sobre WPS, un clon de SAS. Ahora he descubierto que también es posible ejecutar SAS sin SAS. Un producto de la empresa Dulles Research permite compilar código ...

¿Qué hacer con los valores perdidos de nuestras variables?

Miércoles, Septiembre 16th, 2009

Creo que casi todos los que han hecho modelos matemáticos alguna vez en su vida se han encontrado con la pregunta que titula este breve  artículo. Aunque más que artículo es una reflexión y sobre todo espero que al final sea un pequeño foro de ideas y de métodos con ...

Monográfico. Arboles de clasificación con RPART

Lunes, Agosto 31st, 2009

Con este rápido monográfico voy a acercarnos a los árboles de regresión con R. Esta metodología de predicción realiza construcciones lógicas que establecen reglas que nos permiten clasificar observaciones en función de una variable respuesta y de las relaciones existentes entre las variables dependientes. En esta primera aproximación no no ...

IBM compra SPSS

Martes, Julio 28th, 2009

La noticia es de hoy. Los grandes vendedores de software y servicios quieren completar sus portafolios de productos. SPSS intentó extenderse a otras áreas del BI sin demasiado éxito. IBM hizo lo mismo en el área de la minería de datos. Incluso corrieron rumores de boda entre SAS y Teradata ...