Namensabgleich

Hallo zusammen,

ich würde gerne mithilfe von Knime zwei Spalten einer Tabelle abgleichen.
Und zwar sollen nur die Zeilen angezeigt werden bei denen Auftraggebername und Empfängername identisch bzw. fast gleich sind.

Beispiel:
Hans Müller + Hans Müller -> anzeigen
Hans und Erika Müller + Hans Müller -> anzeigen
Hans Mueler + Hans Müller -> anzeigen
Max Mustermann + Hans Müller -> nicht anzeigen

Vorab vielen Dank für Eure Hilfe.

Viele Grüße
Jan Nickel

This sounds like a job for adress deduplication or ‘fingerprinting’

Concerning adress deduplication @wiswedel provided some very useful workflows

https://hub.knime.com/knime/spaces/Examples/latest/02_ETL_Data_Manipulation/05_Indexing_Searching/03_Example_for_Fuzzy_Address_Matching

Fingerprinting using adresses (ignore the title)

Compare string similarities (you may have to set a threshold)

You would need Palladian for that:

Repository to install Palladian
http://download.nodepit.com/palladian/4.0

1 Like

Hi there @JanSKB,

welcome to KNIME Community!

In general topics are posted on English but if that presents problem to you German will work as well. As you can see :wink:

Br,
Ivan

1 Like

Hi there
thanks for your help.
I found the node “string similiarity”. It is perfect for my issue

2 Likes

This topic was automatically closed 182 days after the last reply. New replies are no longer allowed.