Archivo para la categoría ‘Modelos’

Una fabulilla (sobre PRIM) con múltiples moralejas

Sábado, Diciembre 12th, 2009

–Érase una vez un banco... –¿Me cuenta Vd. un cuento? –Mismamente, señora. –¿Quiérese, pues, decir que cuanto Vd. relate es pura ficción, no pareciéndose ni las personas (físicas o jurídicas) ni los lances de su aún inaudita historia a personas (físicas o jurídicas, respectivamente) y lances reales, casualidades éstas que pudieran derivar, según ...

Manual. Curso introducción de R. Capítulo 18: Modelos de regresión de Poisson

Viernes, Octubre 23rd, 2009

Cuando disponemos de un número de eventos que ocurren en un intervalo tiempo estamos ante una variable de poisson, además tiene que producirse que este número de eventos en intervalos sean independientes del número de eventos que ocurran fuera de ese intervalo de tiempo. En un intervalo muy pequeño la ...

Monográfico. Arboles de clasificación con RPART

Lunes, Agosto 31st, 2009

Con este rápido monográfico voy a acercarnos a los árboles de regresión con R. Esta metodología de predicción realiza construcciones lógicas que establecen reglas que nos permiten clasificar observaciones en función de una variable respuesta y de las relaciones existentes entre las variables dependientes. En esta primera aproximación no no ...

Sobre la historia de CART y rpart

Jueves, Junio 25th, 2009

Hace unos días conversábamos Raúl y yo sobre árboles de clasificación. En particular, hablábamos de CART, el algoritmo propietario de Salford Systems. Me intrigó saber cuál sería la diferencia entre dicho algoritmo y la alternativa existente en R, rpart. El autor de dicho paquete, Terry Therneau,  tuvo la gentileza de ofrecer ...

Manual. Curso introducción de R. Capítulo 17: Análisis Cluster con R (y III)

Lunes, Junio 8th, 2009

Ante el exito de los mensajes dedicados al análisis cluster la nueva entrega del manual de R la dedicaremos de nuevo al análisis de agrupamiento. Como es habitual trabajaremos con un ejemplo que podéis desgargaros aquí. Partimos de un archivo de texto delimitado por tabuladores con 46 frutas y la ...

Manual. Curso introducción de R. Capítulo 16: Análisis Cluster con R (II)

Lunes, Mayo 4th, 2009

En esta entrega vamos a seguimos trabajando con el análisis Cluster viendo más posibilidades que nos ofrece R. Para ello vamos a realizar un estudio de agrupamiento de países europeos en función de algunos indicadores básicos: Superficie Población PIB (en mil de $) Esperanza de vida Índice de desarrollo humano % Población en ciudad Para este ...

Manual. Curso introducción de R. Capítulo 15: Análisis Cluster con R (I)

Jueves, Abril 23rd, 2009

El proposito del análisis de conglomerados (cluster en terminología inglesa) es el agrupar las observaciones de forma que los datos sean muy homogéneos dentro de los grupos (mínima varianza) y que estos grupos sean lo más heterogéneos posible entre ellos (máxima varianza). De este modo obtenemos una clasificación de los ...

Macros SAS. Tramificar en función de una variable respuesta

Miércoles, Abril 8th, 2009

Sobre la idea de “dumificar” variables he ideado un proceso para agrupar variables cuantitativas en función de una variable respuesta. Los que disponéis de herramientas de análisis más complejas tipo Enterprise Miner o Clementine ya disponéis de algoritmos y funciones que realizan esta útil tarea, además los árboles pueden trabajar ...

Manual. Curso introducción de R. Capítulo 14: Introducción al cálculo matricial con análisis de componentes principales

Sábado, Enero 17th, 2009

Para el trabajo con matrices vamos a emplear un análisis de componentes principales. El análisis de componentes principales puede encuadrarse dentro del conjunto de técnicas multivariantes conocidas como métodos factoriales (también se incluyen el análisis de factores y el análisis de correspondencias). Pretendemos sintetizar un gran conjunto de datos, crear ...

Manual. Curso introducción de R. Capítulo 13: Análisis de la varianza. Diseños anidados

Lunes, Enero 12th, 2009

Continuamos con ejemplos de análisis de la varianza con R. En este caso trabajaremos con diseño de experimentos anidados. Definimos un factor B está anidado a un factor A si para nivel de B tenemos un único nivel de A asociado, es decir, A dos niveles, B tres niveles; A1 ...