Das Durchsuchen einer alphabetisch geordneten Datei in Python ist langsam

Das Durchsuchen einer alphabetisch geordneten Datei in Python ist langsam ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Das Durchsuchen einer alphabetisch geordneten Datei in Python ist langsam

Post by Guest » 12 Jan 2025, 18:10

Ich habe zwei Textdateien, beide alphabetisch sortiert.
wordlist.txt, die eine Liste eindeutiger Wörter enthält:

(word)
a
ad
and
at

dictionary.txt, das eine Liste nicht eindeutiger Wörter enthält, gefolgt von einem Tabulator und einer Definition:

Code: Select all

(word)  (definition)
and congiunzione
at  abbreviazione
at  avverbio

Für jedes Wort in wordlist.txt muss ich dictionary.txt durchsuchen, bis ich die erste Übereinstimmung finde und die entsprechenden sammle Definition und die nachfolgenden, falls vorhanden.
Sobald ich sie gesammelt habe, unterbreche ich den Suchzyklus, da es sinnlos wäre, die dictionary.txt weiter zu durchsuchen.
Ich fahre mit der fort nächster Eintrag in wordlist.txt und so weiter.
Dies ist ein Auszug meines Codes:

Code: Select all

for wordtosearch in open("wordlist.txt", "r"):
found = 0
isfound = False

for dictionaryentry in open("dictionary.txt", "r"):
dictionaryelements = dictionaryentry.split("\t") #split the word and the definition

if wordtosearch == dictionaryelements[0]:
# ... here I gather the definition and I concatenate it to the previous one
found += 1   #at least 1 entry is found
isfound = True
else:
isfound = False

#if we don't have a match in the current cicle but we've had at least un match before, it means we can stop search further
if found > 0 and isfound == False:
break

Wie Sie sehen, muss ich für jedes wordtosearch das Wörterbuch durchsuchen, bis das Wort gefunden wird. Das nimmt viel Zeit in Anspruch, da sowohl die Wortliste als auch das Wörterbuch Hunderte von Einträgen enthalten, und selbst wenn ich es weggelassen habe, müsste ich tatsächlich fünf verschiedene Wörterbücher durchsuchen.
Ich habe über das Speichern nachgedacht die Zeilennummer, in der das vorherige Wort übereinstimmte, sodass die Suche nach dem nächsten Wort in dieser Zeile von dictionary.txt beginnt und nicht am Anfang.
Wenn für das vorherige Wort keine Übereinstimmung gefunden wird, verwende ich die vorheriges dazu und so weiter.
Wäre das eine gute Lösung? Oder bietet Python etwas Besseres, das ich nicht kenne?
Ich bin übrigens nicht auf Python beschränkt, wenn Sie etwas Besseres wissen, sondern auf Windows.

1736701829

Guest

Ich habe zwei Textdateien, beide alphabetisch sortiert.
[b]wordlist.txt[/b], die eine Liste eindeutiger Wörter enthält:
[code](word)
a
ad
and
at
[/code]
[b]dictionary.txt[/b], das eine Liste nicht eindeutiger Wörter enthält, gefolgt von einem Tabulator und einer Definition:
[code](word)  (definition)
and congiunzione
at  abbreviazione
at  avverbio
[/code]
Für jedes Wort in [b]wordlist.txt[/b] muss ich [b]dictionary.txt[/b] durchsuchen, bis ich die erste Übereinstimmung finde und die entsprechenden sammle Definition und die nachfolgenden, falls vorhanden.
Sobald ich sie gesammelt habe, unterbreche ich den Suchzyklus, da es sinnlos wäre, die dictionary.txt weiter zu durchsuchen.
Ich fahre mit der fort nächster Eintrag in [b]wordlist.txt[/b] und so weiter.
Dies ist ein Auszug meines Codes:
[code]for wordtosearch in open("wordlist.txt", "r"):
found = 0
isfound = False

for dictionaryentry in open("dictionary.txt", "r"):
dictionaryelements = dictionaryentry.split("\t") #split the word and the definition

if wordtosearch == dictionaryelements[0]:
# ... here I gather the definition and I concatenate it to the previous one
found += 1   #at least 1 entry is found
isfound = True
else:
isfound = False

#if we don't have a match in the current cicle but we've had at least un match before, it means we can stop search further
if found > 0 and isfound == False:
break
[/code]
Wie Sie sehen, muss ich für jedes [b]wordtosearch[/b] das [b]Wörterbuch[/b] durchsuchen, bis das Wort gefunden wird. Das nimmt viel Zeit in Anspruch, da sowohl die Wortliste als auch das Wörterbuch Hunderte von Einträgen enthalten, und selbst wenn ich es weggelassen habe, müsste ich tatsächlich fünf verschiedene Wörterbücher durchsuchen.
Ich habe über das Speichern nachgedacht die Zeilennummer, in der das vorherige Wort übereinstimmte, sodass die Suche nach dem nächsten Wort in dieser Zeile von dictionary.txt beginnt und nicht am Anfang.
Wenn für das vorherige Wort keine Übereinstimmung gefunden wird, verwende ich die vorheriges dazu und so weiter.
Wäre das eine gute Lösung? Oder bietet Python etwas Besseres, das ich nicht kenne?
Ich bin übrigens nicht auf Python beschränkt, wenn Sie etwas Besseres wissen, sondern auf Windows.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Sortieren Sie Optionen in einer Auswahlliste alphabetisch und behalten Sie Ereignis-Listener bei

Last post by Guest « 05 Jan 2025, 06:10
Posted in JavaScript

by Guest » 05 Jan 2025, 06:10 » in JavaScript

Ich muss die Optionen in einer Auswahlliste alphabetisch sortieren. Ich kann nicht einfach die innerHTML- und value-Attribute wechseln, da an einige Optionen Klassen und Ereignis-Listener angehängt...

0 Replies

26 Views

Last post by Guest
05 Jan 2025, 06:10
Asp.Net Core Swagger Tags alphabetisch sortieren

Last post by Guest « 03 Jan 2025, 17:50
Posted in C#

by Guest » 03 Jan 2025, 17:50 » in C#

Ich verwende asp.net core 6 und Swashbuckle.AspNetCore
und ich verwende SwaggerAnnotations in meinen Aktionen
Aber meine Tags Gruppen sind nicht geordnet
Hier ist meine Swagger-UI-Seite

Mein...

0 Replies

11 Views

Last post by Guest
03 Jan 2025, 17:50
Durchsuchen Sie Daten in einer Datei in einer Klasse basierend auf Benutzereingaben in C++

Last post by Guest « 17 Jan 2025, 05:36
Posted in C++

by Guest » 17 Jan 2025, 05:36 » in C++

Ich muss das System in die Lage versetzen, die Mahlzeitdetails basierend auf der vom Benutzer eingegebenen Mahlzeit-ID zu durchsuchen. Wenn der Benutzer die Mahlzeit-ID 01 eingibt, werden die...

0 Replies

21 Views

Last post by Guest
17 Jan 2025, 05:36
Fehler beim Durchsuchen einer Datei in NetBeans

Last post by Anonymous « 03 Mar 2025, 00:33
Posted in Java

by Anonymous » 03 Mar 2025, 00:33 » in Java

private void SearchbtnActionPerformed(java.awt.event.ActionEvent evt) {
String answer1 = TxtFi.getText();
Scanner sc = new Scanner(answer1);
name = sc.nextLine();
try {
getRootPath();

} catch...

0 Replies

8 Views

Last post by Anonymous
03 Mar 2025, 00:33
So durchsuchen Sie eine bestimmte Zeichenfolge in einer Datei mithilfe von Muster -Matcher in Java

Last post by Anonymous « 11 Aug 2025, 06:38
Posted in Java

by Anonymous » 11 Aug 2025, 06:38 » in Java

Ich habe die folgende Ausnahmestapel -Trace

java.net.SocketException: ***Connection reset***
at java.net.SocketInputStream.read(SocketInputStream.java:197)
at...

0 Replies

0 Views

Last post by Anonymous
11 Aug 2025, 06:38

Return to “Python”