Archivo para la categoría ‘R’

La distribución tweedie

Lunes, Abril 23rd, 2012

  Reconozco que hace muy poco tiempo que trabajo con las distribuciones tweedie. Un viejo dinosaurio que trabaja sobre todo con SAS se hace el sordo cuando le hablan de la distribución tweedie. Quizá sea el trabajo con SAS el que me ha nublado. Pero ahora que empiezo a trabajar con ...

R cayendo en la lista TIOBE

Lunes, Abril 16th, 2012

No me ha gustado esta sorpresa en la lista TIOBE de abril de 2012: R cae por debajo del puesto 30 y se ve superado tanto por SAS como por MATLAB. ¿Será una tendencia? Hay que seguir esta evolución en los próximos meses.

Data mining, Business intelligence (y/o la nube)

Martes, Abril 3rd, 2012

Hace tiempo que quería publicar una entrada en respuesta a estos comentarios escritos en el blog. Se trata de analizar las búsquedas en Google a través de Google Trends de los términos: Business Intelligence, Data Mining, Cloud Computing y NOSQL. El resultado es más que interesante: En rojo tenemos Data Mining, ...

Sobremuestreo y pesos a las observaciones. Ahora con R

Martes, Marzo 27th, 2012

De nuevo volvemos a la entrada de ayer para replicar el código SAS utilizado en R. Se trata de realizar 3 modelos de regresión logística con R para estudiar como influyen en los parámetros el uso de un conjunto de datos con sobremuestreo o el uso de un conjunto de ...

Mapas con R en Omnia sunt Communia!

Domingo, Marzo 4th, 2012

EXCEPCIONAL serie monográfica de mensajes del blog Omnia sunt Communia! sobre la realización de mapas con R. Parte I mapa de la distribución de votos de las elecciones 2011 en España. Gran trabajo con los datos de mapas municipales del INE. Parte II mapas de puntos de colores. Increible el mapa de ...

¿Quién ganará la liga española? Una simulación poco seria con R

Sábado, Febrero 4th, 2012

Está a punto de acabar un partido de futbol entre la Real Sociedad y el Barcelona y me temo que esta jornada vuelven a ganar los equipos que más dinero ganan por los derechos televisivos de la liga española. El Real Madrid está a 7 puntos del Barcelona. Está claro ...

Da comienzo la lectura de “The Elements of Statistical Learning”

Martes, Enero 10th, 2012

Interesante iniciativa de Juanjo Gibaja y Carlos Gil Bellosta consistente en leer el libro “The Elements of Statistical Learning”. La idea es crear un grupo de trabajo que lea de forma coordinada el libro, pero además van a implementar en R los ejercicios y ejemplos. Desde esta bitácora no vamos ...

Informes con R en HTML. Comienzo con R2HTML (I)

Lunes, Noviembre 28th, 2011

En las III jornadas de R tuve el placer de asistir al taller de Gregorio Serrano sobre informes con R. Me abrió los ojos. Siempre he pensado que R no es una herramienta que sirva para hacer informes [modo consultor = ON] R no servía para realizar reporting  [modo consultor ...

Revisión de las III Jornadas de R

Lunes, Noviembre 21st, 2011

El día 18 de noviembre finalizaron las III jornadas de R y mis impresiones no pueden ser más positivas. A nivel organizativo todo funcionó a la perfección, algo muy meritorio teniendo en cuenta que los organizadores no son expertos en el tema y es muy difícil organizar un evento con ...

El sobremuestreo ¿mejora mi estimación?

Domingo, Noviembre 6th, 2011

El sobremuestreo (oversampling) es una técnica de muestreo que se emplea habitualmente cuando tenemos una baja proporción de casos positivos en clasificaciones binomiales. Los modelos pueden “despreciar” los casos positivos por ser muy pocos y nuestro modelo no funcionaría. Para incrementar el número de casos positivos se emplea el sobremuestreo. ...