Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:
- rpart, tal vez mi favorito
- RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R
- mvpart
- party
Cada uno de ellos tiene un interfaz distinto y operaciones como las de realizar predicciones, dibujar los árboles, etc. exigen conocer funciones específicas. (Éste es, de hecho, un problema genérico de R derivado de su naturaleza cooperativa).
Pero la situación va a cambiar con el paquete partykit, todavía en fase de desarrollo, que, según sus autores, va a ofrecer «una representación unificada de los árboles, así como métodos predict()
, print()
y plot()
«. Esto además de otras novedades, como una reimplementación del algoritmo CHAID y mejoras en la visualización de algunos de los tipos de árboles más habituales.
La presentación en sociedad del nuevo paquete va a realizarse en la conferencia de usuarios de R y es de esperar que, una vez dispongamos de una versión estable del paquete, cambie de manera sustancial la manera en que utilicemos esta familia de modelos tan importante en la práctica.
Muy interesante,
Creo que la posibilidad de utilizar cómodamente este tipo de modelos puede acercar a R a un tipo de público más amplio.
Muchas gracias por la información. Es, precisamente, lo que andaba buscando.
Saludos.