Archivo para la categoría ‘Modelos’

Entrenamiento, validación y test

Miércoles, Julio 28th, 2010

Cuando realizamos modelos hay 3 conjuntos de datos fundamentales: Conjunto de datos de entrenamiento: son los datos que entrenan los modelos Conjunto de datos de validación: selecciona el mejor de los modelos entrenados Conjunto de datos de test: Nos ofrece el error real cometido con el modelo seleccionado Para entender mejor su importancia y ...

El modelo multivariante en el sector asegurador. Las variables independientes (IV)

Martes, Julio 6th, 2010

Ya hemos hablado de la variable dependiente en nuestros modelos multivariantes. Ahora toca analizar las variables independientes que "explicarán" cada una de las variables dependientes que aparecen en nuestros modelos de frecuencias siniestrales y costes medios. A estas variables independientes las denominaremos factores influyentes en la tarifa o factores de ...

Monográfico. Un poco de PROC LOGISTIC

Jueves, Junio 24th, 2010

El PROC LOGISTIC es un procedimiento de SAS que nos ha dado muchas satisfacciones a los dinosaurios como el ahora escribiente. La regresión logística es uno de los modelos de regresión más utilizados y es bien conocido por todos mis lectores (bastante más inteligentes que yo). El problema es muy ...

Monográfico. Clasificación con SVM en R

Martes, Junio 15th, 2010

Las máquinas de vectores de soporte, Support Vector Machines, SVM a partir de ahora, son un conjunto de técnicas estadísticas que nos permiten clasificar una población en función de la partición en subespacios de múltiples variables. Parte de la idea de dividir de forma lineal un conjunto de múltiples dimensiones. ...

El modelo multivariante en el sector asegurador. Introducción (I)

Miércoles, Abril 14th, 2010

Con ese artículo comienza una serie que nos permitirá aproximarnos a los métodos estadísticos multivariantes empleados para la obtención de la estructura óptima de la tarifa en un el sector asegurador. No es un método novedoso. La práctica totalidad de las compañías aseguradoras cuentan con estos procesos en su operativa ...

Monográfico. Análisis de Factores con R (una introducción)

Jueves, Febrero 11th, 2010

El análisis de factores es una técnica de reducción de datos: menor dimensión mayor portentaje de varianza. Distinguimos el análisis factorial exploratorio del análisis factorial confirmatorio en función del conocimiento del número de factores a obtener. Este análisis está muy relacionado con el análisis de componentes principales pero no buscamos ...

Monográfico. Regresión logística con R

Viernes, Enero 29th, 2010

Por fin nos metemos con la regresión logística en R. Nos meteremos con WPS (si es posible). Los modelos de regresión logística son los más utilizados en las áreas en las que el ahora escribiente ha trabajado. ¿Por qué tiene tanto "éxito"? Porque es el mejor ejemplo de modelo de ...

Lectura del fin de semana

Sábado, Enero 9th, 2010

Buena lectura de fin de semana. Me da vergüenza reconocer que no lo conocía, es de 2003. Me está gustando bastante, tiene una breve introducción a R y tiene una visión muy práctica.   Saludos.

Monografico. Arboles de decisión con party

Sábado, Enero 9th, 2010

Los árboles de clasificación son una de las técnicas de análisis más utilizadas. No requieren supuestos distribucionales, permite detectar interacciones entre variables y no es muy sensible a la presencia de valores perdidos y outliers. En resumen, es una técnica que no quita mucho tiempo al analista para hacer ...

Una fabulilla (sobre PRIM) con múltiples moralejas

Sábado, Diciembre 12th, 2009

–Érase una vez un banco... –¿Me cuenta Vd. un cuento? –Mismamente, señora. –¿Quiérese, pues, decir que cuanto Vd. relate es pura ficción, no pareciéndose ni las personas (físicas o jurídicas) ni los lances de su aún inaudita historia a personas (físicas o jurídicas, respectivamente) y lances reales, casualidades éstas que pudieran derivar, según ...