Archivo de la etiqueta: xmlToDataFrame

Trucos R. Leer archivos XML con R

Un truco de R práctico que busca la colaboración de los lectores para mejorarlo. Se trata de leer ficheros xml con R. Los más asiduos ya sabéis que paquete voy a emplear, el XML. En los últimos tiempos la sentencia require(XML) aparece al principio de casi todos mis códigos en el Tinn-R. El ejemplo que ilustrará el truco lee de la BBDD del banco mundial en español el indicador de emisiones de CO2 en toneladas por habitante y año. La sintaxis es de este modo:


#Paquete necesario para leer XML
require(XML)
arch = "http://datos.bancomundial.org/sites/default/files/indicators/es/co2-emissions-metric-tons-per-capita_es.xml"
doc <- xmlTreeParse(arch,getDTD=T,addAttributeNamespaces=T)
arriba = xmlRoot(doc)
#Vemos los nombres de los campos de la tabla
names(arriba[[1]])

Leemos directamente de la web el documento XML. xmlTreeParse crea la estructura del XML en R, de este modo podemos acceder a los datos. Lo primero que vamos a hacer es saber los nombres de las columnas que deseamos leer, para ello xmlRoot obtiene los nodos raiz de la estructura que hemos leído. La función names obtiene los nombres Seguir leyendo Trucos R. Leer archivos XML con R