Archivo para la categoría ‘R’
Lunes, Abril 19th, 2010
El paquete plyr de R tiene unas funciones que nos permiten hacer sumarizaciones de forma muy rápida y sencilla. Hoy quería trabajar con la función ddply. Todos esos resúmenes y agregaciones que nos cuestan mucho código con la función ddply pasan a ser de lo más sencillo. Al tajo, o ...
Publicado en Formación, R, Trucos | No hay Comentarios »
Sábado, Abril 10th, 2010
Me gustaría plantearos un problema que me ha ocurrido recientemente con SAS. Necesitaba todas las posibles combinaciones de 9 elementos tomados de n en n. Tenia que crear un dataset con todas estas combinaciones. Antes de ponerme a programar toca buscar en Google "sas combinations" y tras un rato buscando ...
Publicado en Formación, R, SAS, Trucos | 1 Comentario »
Jueves, Abril 1st, 2010
Quiero trabajar hoy con la función put de SAS para la creación de ficheros ejecutables de Windows (.BAT) y también quiero comunicar SAS con R. Mato dos pájaros de un tiro y para ello vamos a crear un script de R que llamaremos desde SAS a partir de ...
Publicado en Formación, R, SAS | No hay Comentarios »
Martes, Marzo 30th, 2010
Serie de 4 videos de REvolution que aconsejo ver:
[youtube]http://www.youtube.com/watch?v=M2u7kbcXI_k[/youtube]
La verdad es que no estoy siguiendo mucho a REvolution Computing. Si os soy sincero me pone mas WPS y el bridge to R.
Publicado en Consultoría, Formación, R | No hay Comentarios »
Lunes, Marzo 29th, 2010
En los últimos tiempos he hablado mucho y mal de R en los "ambientes". El problema de siempre puede terminar con la paciencia de cualquiera, la manipulación de datos con R cuando superamos un GB puede acabar con la paciencia de este viejo dinosaurio. Viejo por usado no por mi edad, ...
Publicado en Consultoría, Data Mining, R | 5 Comentarios »
Jueves, Marzo 18th, 2010
Sigo añadiendo pocos mensajes al blog por falta de tiempo. Corren malos tiempos para el ahora escribiente. A este paso el blog no llegara nunca a las 4.000 visitas mensuales objetivo muy ambicioso para este 2010. Pero en este mensaje quería enlazar el blog de un ex compañero:
http://miguelinlas3.blogspot.com/
Interesante proyecto que ...
Publicado en R | No hay Comentarios »
Jueves, Febrero 18th, 2010
Interesante datos de Intelligent Enterprise.
¿Qué empresa tenemos que seguir durante este 2010 en la categoría de BI?
La lástima es que el BI está moribundo. En 2012 será un concepto obsoleto. Por cierto, R-project tiene que plantearse esa web de una vez por todas.
Publicado en Business Intelligence, R | 6 Comentarios »
Jueves, Febrero 11th, 2010
El análisis de factores es una técnica de reducción de datos: menor dimensión mayor portentaje de varianza. Distinguimos el análisis factorial exploratorio del análisis factorial confirmatorio en función del conocimiento del número de factores a obtener. Este análisis está muy relacionado con el análisis de componentes principales pero no buscamos ...
Publicado en Formación, Modelos, Monográficos, R | No hay Comentarios »
Domingo, Enero 31st, 2010
Muy habitual partinos la cabeza con valores perdidos en R. Los NA pueden darnos algún quebradero de cabeza. Este truco es muy sencillo, transforma valores missing a 0 y nos sirve para aplicar funciones a data.frame con la función sapply. Veamos el sencillo ejemplo:
x=c(1,23,5,9,0,NA)
y=c(5,45,NA,78,NA,34)
dataf=data.frame(cbind(x,y))
mean(dataf$x,na.rm=TRUE)
mean(dataf$y,na.rm=TRUE)
#Podría interesarnos tener en cuenta los NAs
sum(dataf$x,na.rm=TRUE)/nrow(dataf)
sum(dataf$y,na.rm=TRUE)/nrow(dataf)
Tenemos ...
Publicado en R, Trucos | No hay Comentarios »
Viernes, Enero 29th, 2010
Por fin nos metemos con la regresión logística en R. Nos meteremos con WPS (si es posible). Los modelos de regresión logística son los más utilizados en las áreas en las que el ahora escribiente ha trabajado. ¿Por qué tiene tanto "éxito"? Porque es el mejor ejemplo de modelo de ...
Publicado en Data Mining, Formación, Modelos, Monográficos, R | 8 Comentarios »