Lectura ficheros de SHP tomando nombre fichero

juanqui3C · June 6, 2021, 9:51am

Hola:

Necesito agrupar ficheros, con idéntica estructura, que tengo en una biblioteca de SHP. Esos ficheros no tienen internamente ningún campo que informe la fecha en la que se crearon. La única referencia sobre fecha está en el nombre de los ficheros, que tienen una parte común junto con la fecha de creación. (con excel reader puede tenerlos agrupados pero sin la información de fecha de creación)

He localizado en el Hub un flujo que con un nodo java realiza el proceso de lectura del nombre de cada fichero:

https://hub.knime.com/knime/spaces/Examples/latest/06_Control_Structures/04_Loops/02_Example_for_Reading_a_List_of_Files~UPm1nNWmew1uu2L0

lectura ficheros_0

El inconveniente que encuentro es cómo seguir a partir de List Files/Folders.

No sé cómo ni qué variables de flujo utilizar a partir de la única información que devuelve List Files/Folder:

lectura ficheros

Si pudiera obtener el campo Row ID, supongo que posteriormente podré extraer con un cell spliter por posición el año , día y mes.

¿Alguna orientación?

Saludos y gracias.

aworker · June 6, 2021, 3:09pm

Hola @juanqui3C

No me queda muy claro lo que quieres hacer. Basado en las copias de pantalla que nos has enviado, puedes por favor componer a mano el resultado esperado, por ejemplo escrito en un fichero Excel y subirlo aqui, para que te podamos ayudar ?

Estoy seguro que no es complicado lo que quieres hacer, pero con un ejemplo del resultado será más fácil ayudarte.

Saludos,

Ael

juanqui3C · June 7, 2021, 6:52am

Hola @aworker

Adjunto un esquema , utilizando los datos del flujo de ejemplo que encontré en el Hub.
Básicamente lo que voy buscando es conseguir que sobre la información que obtendría leyendo la biblioteca de SHP, en donde están todos los ficheros con igual estructura y que con un excel reader obtengo en un único fichero, se pueda incluir un campo que contenga el nombre de cada fichero que contribuye a la formación de ese fichero único.
ejemplo.xlsx (10.7 KB)
Muchas gracias.

aworker · June 7, 2021, 7:53am

Hola @juanqui3C

Gracias por el ejemplo del resultado esperado de datos. Creo que lo que hace falta es un lazo “chunk loop”. He implementado la solucion aqui adjunta:

20210607 PIKAIROS Lectura ficheros de SHP tomando nombre fichero.knwf (2.7 MB)

A cada iteracion del lazo, el chunk loop lee un solo nombre de la lista de ficheros y el “Table Row to Variable” lo convierte en variable" para que el “Excel Reader” pueda leerlo. Adjuntar el nombre del fichero a las lineas (rows) leidas, se hace por medio de un nodo “Cross Joiner” que adjunta el nombre del fichero actual a todas las lineas del tablero leido. Al final todo se concatena por lineas. Evidentemente, otras soluciones son posibles en KNIME.

Espero que sea de ayuda.

Saludos,

Ael

juanqui3C · June 7, 2021, 12:27pm

Hola @aworker:

Muchas de antemano por el interés. El resultado mostrado es el que voy buscando.
Encuentro una diferencia con mi escenario, justo en el arranque. En el ejemplo, el nodo list files tiene dos campos : location y url

y emplea una variable de flujo “temp_path”.
ejemplo1_1

En mi escenario list file tiene esta estructura:

lectura ficheros

Desconozco qué variable alternativa a temp_path utilizar dentro del nodo list file y si como alternativa a url , que en mi caso no existe, puedo utilizar otra relativa al campo “path”.

Como verás tengo bastante lío con las variables a emplear. No sé si tiene encaje el ejemplo al venir el origen de datos de SHP

Saludos,

aworker · June 7, 2021, 12:49pm

Hola @juanqui3C

Normalmente, si tu fichero esta en el “Path” que me indicas y puedes leerlo usando ese Path con un nodo Excel Reader, entonces lo unico que tienes que hacer es usar la variable “Path”. Pero ya veo cual es el problema y es que estas leyendo tus ficheros Excel de forma remota a traves de un SharePoint.

Por otro lado, debes remplazar el nodo “File Reader” por un “Excel Reader”. Dentro del “Excel Reader” debieras normalmente poder configurar el acceso de la misma manera pero con respecto al “Mount Point” de tu “SharePoint”:

Tienes que remplazar el “File Reader” por un “Excel Reader” y dentro, configurar “Read From:” como “Mountpoint” con tu punto de montaje del Sharepoint que pienso debiera aparecer en las opciones (opcion donde pone “knime-temps-space”. Siento no poder ser mas claro ya que yo no uso SharePoint, asi que no puedo serte de mas ayuda ya que no puedo probarlo en mi instalacion. Espero que estas explicaciones te ayuden a resolverlo o que otros en el forum puedan ayudarte.

Saludos,

Ael

PS: Para este problema un poco especial, te aconsejo que formules tu pregunta en ingles ya que tendras mucha mas audiencia y respuestas. Espero sino que alguien te pueda responder en español. Suerte !

juanqui3C · June 7, 2021, 5:31pm

Gracias @aworker por todo tu tiempo e interés. Investigaré un poco más con tus orientaciones y si no lo consigo, lo planteo en el foro general.

Saludos.

aworker · June 7, 2021, 5:33pm

Es un placer @juanqui3C

Suerte !

Saludos,

Ael

gonhaddock · June 24, 2021, 9:21pm

Hola @juanqui3C
Han pasado varios días pero estaba viendo posts que no parecían tener solución…
Te adjunto un workflow que puede servirte de ejemplo para lo que intentas hacer.

Reemplaza el ‘Table Creator’ del flujo por el ‘Excel Reader’, conectado por el puerto de variables, para que pueda leer de tu sistema de ficheros.

KNIME_extraer_strings.knwf (37.1 KB)

El tema de la lectura de Excel desde Sharepoint puede ser complejo porque el servidor rechace la conexión de lectura… si la dimensión del trabajo lo permite, intenta leer desde tu sistema local en OneDrive

Un saludo

system · July 24, 2021, 9:22pm

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.