Wie kann ich Firmennamen und -adressen genau übereinstimmen, um doppelte Unternehmen zu identifizieren? - Programmiererforum

Wie kann ich Firmennamen und -adressen genau übereinstimmen, um doppelte Unternehmen zu identifizieren? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann ich Firmennamen und -adressen genau übereinstimmen, um doppelte Unternehmen zu identifizieren?

Report
Quote

Post by Anonymous » 17 Feb 2025, 11:07

Beschreibung:
Ich arbeite an einem Projekt, bei dem ich feststellen muss, ob zwei Unternehmensunterlagen das gleiche Unternehmen darstellen oder nicht. Die Daten, die ich für jedes Unternehmen habe
City
State
Pincode
Telefonnummern (in einigen Fällen verfügbar, aber nicht immer)
Herausforderungen:
inkonsistente Firmennamen: < /p> < BR /> Beispiele: "ABC Pvt Ltd" gegen "ABC Private Limited" oder "XYZ Corp." vs. "X.Y.Z Corporation"
Rechtschreibfehler und Abkürzungen sind ebenfalls häufig. Zum Beispiel:
"123, Mg Road" vs. "123 mg rd"
"Gebäude Nr. 5" gegen "BLDG 5"
"Sektor-15" vs. "Sec- 15 "< /p>
Teildaten: In einigen Fällen fehlen oder unvollständige Telefonnummern. Gewicht für bestimmte Felder (z. B. Pincode und Gebäudenummer) als andere? . . Algorithmus: Soll ich Fuzzy -Matching, semantische Ähnlichkeit oder ein Modell für maschinelles Lernen verwenden? (z. B. Pincode und Gebäudenummer) gegenüber anderen?

1739786855

Anonymous

Beschreibung:
Ich arbeite an einem Projekt, bei dem ich feststellen muss, ob zwei Unternehmensunterlagen das gleiche Unternehmen darstellen oder nicht. Die Daten, die ich für jedes Unternehmen habe
City
State
Pincode
Telefonnummern (in einigen Fällen verfügbar, aber nicht immer)
Herausforderungen:
inkonsistente Firmennamen: < /p> < BR />  Beispiele: "ABC Pvt Ltd" gegen "ABC Private Limited" oder "XYZ Corp." vs. "X.Y.Z Corporation"
Rechtschreibfehler und Abkürzungen sind ebenfalls häufig. Zum Beispiel:
"123, Mg Road" vs. "123 mg rd"
"Gebäude Nr. 5" gegen "BLDG 5"
"Sektor-15" vs. "Sec- 15 "< /p>
Teildaten: In einigen Fällen fehlen oder unvollständige Telefonnummern. Gewicht für bestimmte Felder (z. B. Pincode und Gebäudenummer) als andere? . . Algorithmus: Soll ich Fuzzy -Matching, semantische Ähnlichkeit oder ein Modell für maschinelles Lernen verwenden? (z. B. Pincode und Gebäudenummer) gegenüber anderen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich Java-Streams verwenden, um doppelte und nicht doppelte Elemente aus einer Liste zu ermitteln?

Last post by Anonymous « 24 Dec 2024, 09:04
Posted in Java

by Anonymous » 24 Dec 2024, 09:04 » in Java

Mir wurde diese Aufgabe gegeben: Der Vektor A = ist gegeben. Schreiben Sie die Funktion, die in einem Vektor B alle eindeutigen Elemente und in einem anderen Vektor C alle Werte anzeigt, die ohne...

0 Replies

58 Views

Last post by Anonymous
24 Dec 2024, 09:04
Wie kann ich Java-Streams verwenden, um doppelte und nicht doppelte Elemente aus einer Liste zu ermitteln?

Last post by Guest « 24 Dec 2024, 11:38
Posted in Java

by Guest » 24 Dec 2024, 11:38 » in Java

Mir wurde diese Aufgabe gegeben: Der Vektor A = ist gegeben. Schreiben Sie die Funktion, die in einem Vektor B alle eindeutigen Elemente und in einem anderen Vektor C alle Werte anzeigt, die ohne...

0 Replies

55 Views

Last post by Guest
24 Dec 2024, 11:38
Doppelte Nachrichten, die empfangen werden, wenn mehrere Abonnements mit eingehender Nachricht übereinstimmen

Last post by Guest « 07 Feb 2025, 00:43
Posted in Java

by Guest » 07 Feb 2025, 00:43 » in Java

getestet mit PAHO Version 1.2.5
In diesem Beispiel sende ich eine Nachricht an das Ziel root/msg/1/data . Ich habe zwei Abonnements: root/msg/1/# und root/msg/+/# . Beide Abonnements stimmen mit der...

0 Replies

30 Views

Last post by Guest
07 Feb 2025, 00:43
Doppelte Nachrichten, die empfangen werden, wenn mehrere Abonnements mit eingehender Nachricht übereinstimmen

Last post by Guest « 10 Feb 2025, 04:47
Posted in Java

by Guest » 10 Feb 2025, 04:47 » in Java

getestet mit PAHO -Version 1.2.5
In diesem Beispiel sende ich eine Nachricht an das Zielroot/msg/1/data
System.out.println( topic: + topic + message: + new String(message1.getPayload(),...

0 Replies

34 Views

Last post by Guest
10 Feb 2025, 04:47
Was macht genau der Parameter-Break-System-Packages, genau das-Break-System-Packages?

Last post by Anonymous « 30 Sep 2025, 20:02
Posted in Python

by Anonymous » 30 Sep 2025, 20:02 » in Python

Dieser Blogeintrag erwähnt Pakete könnten entweder mit PIP oder mit einem Paketmanager (APT, DNF usw.) installiert werden. Diese Mischung von Optionen kann zu unerwünschten Effekten auf das System...

0 Replies

33 Views

Last post by Anonymous
30 Sep 2025, 20:02

Return to “Python”