Como particionar un xml y obtener archivos más pequeños (en cantidad de líneas)

Hola, estoy tratando de hacer un proyecto que lea un archivo xml y lo particione en bloques de 40000 líneas. Ya conseguí dividirlo, me falta armar de vuelta los archivos de salida. Es decir sumar cada etiqueta para los encabezados y en base a eso escribir los archivos xml que necesito obtener.

Hola @GustavoArielF,

Hola,

El nodo Column To XML es un buen punto de partida. También existe el nodo XML Row Combiner, que te permite combinar elementos XML en un elemento principal.

Dale un vistazo a este flujo en los ejemplos de KNIME Hub. Este, muestra cómo crear elementos XML, combinarlos, y también insertar atributos.

Saludos,
Cynthia

Hola @cpadilla. Muchísimas gracias. Lo voy a ver en breve.

Hola, cómo estás? He logrado particionar el xml y obtener el primer segmento. Pero tengo un problema que el archivo de salida es distinto al original (en la estructura)



Ejemplo (original)

<?xml version="1.0" encoding="UTF-8"?>

<General xmlns="" banco=“00931” nroTransaccion=“0”
cbuOrigen=“0000000000000000000000” cuitOrigen=“00000000000”
totalImpDeterminado=“0.00” cbuDestino=“0000000000000000000000” cuitDestino=“00000000000” totalImpRecaudado=“0.00” totalImpDepositado=“0.00” totalImpADepositar=“0.00” totalImpAnulacionTimbradoras=“0.00” registros=“109153”

KNIME

<?xml version="1.0" encoding="UTF-8"?>

table>
General>
banco>00931/banco>
cbuDestino>0000000000000000000000/cbuDestino>
cbuOrigen>0000000000000000000000/cbuOrigen>
cuitDestino>00000000000/cuitDestino>
cuitOrigen>00000000000/cuitOrigen>
fechaRendicion>2021-07-28/fechaRendicion>
nroRendicion>19727/nroRendicion>
nroTransaccion>0/nroTransaccion>
registros>40000.0/registros>

Hola @GustavoArielF

No estoy cien por ciento segura pero quizá usar el XML Colum Combiner en lugar del XML Row Combiner.

Saludos,
Cynthia

Hola @cpadilla. Gracias por tu respuesta. Estoy probando el XML Colum Combiner, pero el problema es el formato de salida del XML. El XML Row Combiner lo uso para volver a “armar” la información (distintos headers).
Saludos.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.