partykit: un paquete de R para generar y manipular árboles de decisión

Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:

  • rpart, tal vez mi favorito
  • RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R
  • mvpart
  • party

Cada uno de ellos tiene un interfaz distinto y operaciones como las de realizar predicciones, dibujar los árboles, etc. exigen conocer funciones específicas. (Éste es, de hecho, un problema genérico de R derivado de su naturaleza cooperativa).

Pero la situación va a cambiar con el paquete partykit, todavía en fase de desarrollo, que, según sus autores, va a ofrecer “una representación unificada de los árboles, así como métodos predict(), print() y plot()“. Esto además de otras novedades, como una reimplementación del algoritmo CHAID y mejoras en la visualización de algunos de los tipos de árboles más habituales.

La presentación en sociedad del nuevo paquete va a realizarse en la conferencia de usuarios de R y es de esperar que, una vez dispongamos de una versión estable del paquete, cambie de manera sustancial la manera en que utilicemos esta familia de modelos tan importante en la práctica.