partykit: un paquete de R para generar y manipular árboles de decisión

Los usuarios de R disponen de una serie de algoritmos estándar para generar y manipular árboles de decisión. Los más habituales están contenidos en alguno de los siguientes paquetes:

  • rpart, tal vez mi favorito
  • RWeka, un paquete más genérico que permite realizar llamadas a funciones de Weka desde R
  • mvpart
  • party

Cada uno de ellos tiene un interfaz distinto y operaciones como las de realizar predicciones, dibujar los árboles, etc. exigen conocer funciones específicas. (Éste es, de hecho, un problema genérico de R derivado de su naturaleza cooperativa).

Pero la situación va a cambiar con el paquete partykit, todavía en fase de desarrollo, que, según sus autores, va a ofrecer “una representación unificada de los árboles, así como métodos predict(), print() y plot()“. Esto además de otras novedades, como una reimplementación del algoritmo CHAID y mejoras en la visualización de algunos de los tipos de árboles más habituales.

La presentación en sociedad del nuevo paquete va a realizarse en la conferencia de usuarios de R y es de esperar que, una vez dispongamos de una versión estable del paquete, cambie de manera sustancial la manera en que utilicemos esta familia de modelos tan importante en la práctica.

2 comentarios en “partykit: un paquete de R para generar y manipular árboles de decisión

  1. Muy interesante,

    Creo que la posibilidad de utilizar cómodamente este tipo de modelos puede acercar a R a un tipo de público más amplio.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *