Gemeinsamkeiten/Abhängigkeiten zu zwei Excel-Files herstellen

josefk_IE · May 29, 2024, 5:57am

Hallo Knime Community!

Folgende Situation:
Ich habe 2 Excel Files die unterschiedliche Datensätze beinhalten.
Ausnahme ist je eine Spalte, die gleich ist.

Ich möchte jetzt eine Excel Liste generieren, die Gemeinsamkeiten/Abhängigkeiten zwischen beiden Files herstellt.
Bzw. sollen Zusammenhänge im Bezug auf Korrelationen und Einflussmatrix dargestellt werden.

Hab dazu 2 Dateien vorbereitet, die das Problem veranschaulichen soll. (schematische Darstellung – orig.Daten weisen +20.000 Zeilen auf)

Bin mit KNIME leider noch nicht so vertraut und würde mich daher über Unterstützung freuen. Vielleicht hat ja zu diesem Thema jemand eine Idee, wie ich das lösen kann.

DANKE für euren Input im Voraus!

Datensatz1.xlsx (9.9 KB)
Datensatz2.xlsx (10.5 KB)

Liebe Grüße
Josef

Daniel_Weikert · May 29, 2024, 4:06pm

Hi
wenn du die Abhängigkeit über die gemeinsame Spalte analysieren willst könntest du die Dateien über die Joiner Node zusammenbringen.
VG

knimediger · May 29, 2024, 8:24pm

@josefk_IE zunächst einmal herzlich willkommen in der Welt von KNIME.

Die beiden Dateien sind wohl die EIngabedaten, die auf Gemeinsamkeiten/Abhängigkeiten untersucht werden sollen.

Es gibt wohl zum einen Arbeitsinfos (Arbeitszeiten ?)

|Auftragsnummer|Arbeitsinhalt|Zeit|

|1|Sitz montieren|0,5|
|1|Motor zusammenbauen|1|
|1|Heizung montieren|0,6|
|1|Tür montieren|0,2|
|1|Tür montieren|0,2|
|1|Heckklappe montieren|0,3|
|1|Scheinwerfer montieren|0,4|
|1|Reserverad im Kofferraum|0,25|
|1|Motor Funktionscheck|0,15|
|1|Fahrzeug Lack|0,1|
|1|Fahrertür vorbereiten|0,3|
|1|Beifahrertür vorbereiten|0,3|
|1|Heckklappe vorbereiten|0,25|
|1|Getriebe montieren|0,35|
|1|Kühler installieren|0,2|
|1|Fahrzeug betanken|0,1|

Zum anderen scheint es Infos zu verbrauchten Teilen zu geben

|Auftragsnummer|Datum|Hersteller|Fabrikat|Ausstattung|

|1|03.02.2016|VW|Golf|Stoffsitze|
|1|03.02.2016|VW|Golf|Benzin Motor|
|1|03.02.2016|VW|Golf|Klimatic|
|1|03.02.2016|VW|Golf|3-türig|
|1|03.02.2016|VW|Golf|Halogen Scheinwerfer|
|1|03.02.2016|VW|Golf|Reserverad|

Verbunden sind diese Datensätze wohl über die Auftragsnummer.
Es stellt sich mir die Frage, was genau das Ergebnis (z.B. dieser beiden Dateien) sein soll?
Was muss ich mir unter “Gemeinsamkeiten/Abhängigkeiten” denn genau vorstellen?

Es wäre hilfreich, wenn du dazu mehr Informationen liefern kannst.

josefk_IE · June 3, 2024, 4:38am

Hallo @Daniel_Weikert ,

danke für deine Rückmeldung!
Die Joiner Node hab ich schon mal getestet. Mir ist aber noch unklar, mit welcher Node ich Abhängigkeiten oder Vergleiche ausführe.

BG
Josef

josefk_IE · June 3, 2024, 4:55am

Hallo @knimediger ,

danke für deine Antwort!
Ja genau, zum einen sind es Arbeitsinhalte und die zweite Liste sollte Vertriebsdaten simulieren. (welche Ausstattung ein Kunde beim Kauf ausgewählt hat)

Mein Ziel wäre es jetzt, dass sich die beiden Datensätze auf Abhängigkeiten verknüpfen lassen.
zB. “Ausstattung Stoffsitze und Ledersitze”
Wie verhält sich die Ausstattung bei Golf vs. Polo?
Wie verhält sich Ledersitz zu Stoffsitz?
Welche Auswirkung hat das auf die Zeit?
.
.

Wie bereits im ersten Post bestehen meine orig. Datensätze aus mehr als 20.000 Zeilen. Daher sollten da die Abhängigkeiten plausibler erscheinen.

BG
Josef

knimediger · June 3, 2024, 1:49pm

@josefk_IE
Die Beschreibung der gewünschten Auswertung ist noch immer etwas knapp.

Mein Ansatz wäre die Tabellen mittels der Join-Node Cross Joiner — NodePit zusammenzufahren und dann die Daten mit Pivot Pivot — NodePit (Modell / Summe Zeite) auszuwerten.
Damit wären dann die ersten Daten verfügbar.
Sind das die Infos, die gewünscht sind?

system · September 1, 2024, 1:49pm

This topic was automatically closed 90 days after the last reply. New replies are no longer allowed.