Ist es möglich, Fuzzy-Match-Merge mit Python-Pandas durchzuführen?Python

Python-Programme
Anonymous
 Ist es möglich, Fuzzy-Match-Merge mit Python-Pandas durchzuführen?

Post by Anonymous »

Ich habe zwei DataFrames, die ich basierend auf einer Spalte zusammenführen möchte. Aufgrund alternativer Schreibweisen, unterschiedlicher Anzahl von Leerzeichen und fehlender/vorhandener diakritischer Zeichen möchte ich jedoch in der Lage sein, sie zusammenzuführen, solange sie einander ähnlich sind.

Jeder Ähnlichkeitsalgorithmus reicht aus (Soundex, Levenshtein, Difflibs).

Angenommen, ein DataFrame enthält die folgenden Daten:

Code: Select all

df1 = DataFrame([[1],[2],[3],[4],[5]], index=['one','two','three','four','five'], columns=['number'])

number
one         1
two         2
three       3
four        4
five        5

df2 = DataFrame([['a'],['b'],['c'],['d'],['e']], index=['one','too','three','fours','five'], columns=['letter'])

letter
one        a
too        b
three      c
fours      d
five       e
Dann möchte ich den resultierenden DataFrame erhalten

Code: Select all

       number letter
one         1      a
two         2      b
three       3      c
four        4      d
five        5      e

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post