Benutzereingabebereich (Tippfehler entfernen: Wenn sie keine Speicherplatz (en) haben

Benutzereingabebereich (Tippfehler entfernen: Wenn sie keine Speicherplatz (en) haben ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Benutzereingabebereich (Tippfehler entfernen: Wenn sie keine Speicherplatz (en) haben

Report
Quote

Post by Anonymous » 17 Jul 2025, 06:20

Ich erstelle eine Grafikabfrage an Cypher und versuche, Benutzereingaben mit Fuzzy -Matching zu verarbeiten und dann mit Lavenshtein -Distanz zu filtern. Dies funktioniert für die meisten Fälle für mich sehr gut, aber ich kämpfe mit Tippfehlern, wenn der Benutzer einen Typ macht, der keinen Platz dort gibt, wo es sein sollte. Grund ist, warum es fehlschlägt, weil ich nicht die vollständige Zeichenfolge mit einer vollständigen Zeichenfolge vergleiche, sondern dafür das Schiebebefenster. Und wenn ich ein einziges Wort habe, wenn es 2 Wörter sein soll, findet es so viele falsch positive Ergebnisse und trifft selten das Ziel. Das Hauptproblem ist, dass ich kurze Zeichenfolge wie Bangna mit wirklich langen Adressen vergleiche, aber es ist nicht nur mit Adressen zusammenhängen und viele verschiedene domänenspezifische Filter sind vorhanden und können das gleiche Problem haben. 10260 < /p>
und Adressen, die Bang Kapi enthält, das Bang -Chak wird zurückgegeben. fulltext_index = f"{node_label}_fulltext"
modified_value = " ".join(word + "~" for word in value.split())
tokens = value.lower().split()
word_count = len(tokens)

# Split input into words and number positions
word_indices = [i for i, tok in enumerate(tokens) if not tok.isdigit()]
number_indices = [(i, tok) for i, tok in enumerate(tokens) if tok.isdigit()]

# Dynamic Levenshtein distance
if any(char.isspace() for char in value):
dist_dynamic = math.ceil(len(value.replace(" ", "")) / 3)
else:
dist_dynamic = len(value.replace(" ", "")) // 3

fulltext_query = (
f'CALL db.index.fulltext.queryNodes("{fulltext_index}", "{modified_value}") YIELD node, score '
f'WITH node, score, '
f'split(apoc.text.replace(toLower(node.value), "[.,/()]", " "), " ") AS node_tokens, '
f'split(toLower("{value}"), " ") AS input_tokens '
f'WITH node, score, node_tokens, input_tokens, '
f'size(node_tokens) AS node_len, '
f'size(input_tokens) AS input_len '
f'WITH node, score, node_tokens, input_tokens, node_len, input_len, '
f'range(0, node_len - {word_count}) AS node_indices '
f'UNWIND node_indices AS n_idx '
f'WITH node, score, '
f'node_tokens[n_idx..n_idx+{word_count}] AS node_phrase_tokens, '
f'split(toLower("{value}"), " ") AS input_phrase_tokens '
)

# Levenshtein only on non-number tokens
fulltext_query += (
f'WITH node, score, node_phrase_tokens, input_phrase_tokens, '
f'apoc.text.levenshteinDistance('
f'apoc.text.join([i IN range(0, size(input_phrase_tokens)-1) WHERE NOT input_phrase_tokens =~ "\\\\d+" | input_phrase_tokens], " "), '
f'apoc.text.join([i IN range(0, size(node_phrase_tokens)-1) WHERE NOT node_phrase_tokens =~ "\\\\d+" | node_phrase_tokens], " ")'
f') AS dist '
)

# Build WHERE clause
where_conditions = [f'dist

1752726022

Anonymous

Ich erstelle eine Grafikabfrage an Cypher und versuche, Benutzereingaben mit Fuzzy -Matching zu verarbeiten und dann mit Lavenshtein -Distanz zu filtern. Dies funktioniert für die meisten Fälle für mich sehr gut, aber ich kämpfe mit Tippfehlern, wenn der Benutzer einen Typ macht, der keinen Platz dort gibt, wo es sein sollte. Grund ist, warum es fehlschlägt, weil ich nicht die vollständige Zeichenfolge mit einer vollständigen Zeichenfolge vergleiche, sondern dafür das Schiebebefenster. Und wenn ich ein einziges Wort habe, wenn es 2 Wörter sein soll, findet es so viele falsch positive Ergebnisse und trifft selten das Ziel. Das Hauptproblem ist, dass ich kurze Zeichenfolge wie Bangna mit wirklich langen Adressen vergleiche, aber es ist nicht nur mit Adressen zusammenhängen und viele verschiedene domänenspezifische Filter sind vorhanden und können das gleiche [url=viewtopic.php?t=26065]Problem[/url] haben. 10260 < /p>
und Adressen, die Bang Kapi enthält, das Bang -Chak wird zurückgegeben.    fulltext_index = f"{node_label}_fulltext"
modified_value = " ".join(word + "~" for word in value.split())
tokens = value.lower().split()
word_count = len(tokens)

# Split input into words and number positions
word_indices = [i for i, tok in enumerate(tokens) if not tok.isdigit()]
number_indices = [(i, tok) for i, tok in enumerate(tokens) if tok.isdigit()]

# Dynamic Levenshtein distance
if any(char.isspace() for char in value):
dist_dynamic = math.ceil(len(value.replace(" ", "")) / 3)
else:
dist_dynamic = len(value.replace(" ", "")) // 3

fulltext_query = (
f'CALL db.index.fulltext.queryNodes("{fulltext_index}", "{modified_value}") YIELD node, score '
f'WITH node, score, '
f'split(apoc.text.replace(toLower(node.value), "[.,/()]", " "), " ") AS node_tokens, '
f'split(toLower("{value}"), " ") AS input_tokens '
f'WITH node, score, node_tokens, input_tokens, '
f'size(node_tokens) AS node_len, '
f'size(input_tokens) AS input_len '
f'WITH node, score, node_tokens, input_tokens, node_len, input_len, '
f'range(0, node_len - {word_count}) AS node_indices '
f'UNWIND node_indices AS n_idx '
f'WITH node, score, '
f'node_tokens[n_idx..n_idx+{word_count}] AS node_phrase_tokens, '
f'split(toLower("{value}"), " ") AS input_phrase_tokens '
)

# Levenshtein only on non-number tokens
fulltext_query += (
f'WITH node, score, node_phrase_tokens, input_phrase_tokens, '
f'apoc.text.levenshteinDistance('
f'apoc.text.join([i IN range(0, size(input_phrase_tokens)-1) WHERE NOT input_phrase_tokens[i] =~ "\\\\d+" | input_phrase_tokens[i]], " "), '
f'apoc.text.join([i IN range(0, size(node_phrase_tokens)-1) WHERE NOT node_phrase_tokens[i] =~ "\\\\d+" | node_phrase_tokens[i]], " ")'
f') AS dist '
)

# Build WHERE clause
where_conditions = [f'dist

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Gibt es eine Möglichkeit, einen Server zu konfigurieren, um PHP -Tippfehler ($ I ohne $ i ++) unendliche Schleifen zu ve

Last post by Anonymous « 23 Apr 2025, 07:30
Posted in Php

by Anonymous » 23 Apr 2025, 07:30 » in Php

Gibt es eine Möglichkeit, einen Server oder in PHP-Einstellungen zu konfigurieren, um PHP für Schleifen-Tippfehler ($ i ohne $ i ++) zu verhindern. for($i=0;$i

0 Replies

16 Views

Last post by Anonymous
23 Apr 2025, 07:30
Zwei Zeiger, die auf denselben Speicherort verweisen. Ist es möglich, sie auf null zu setzen, wenn wir den Speicherplatz

Last post by Anonymous « 18 Oct 2025, 08:42
Posted in C++

by Anonymous » 18 Oct 2025, 08:42 » in C++

Wenn zwei Zeiger auf denselben Speicherort verweisen. Wird es möglich sein, einen Zeiger auf null zu setzen, wenn wir diesen Speicherort freigeben?
Zum Beispiel:
#include
using namespace std;...

0 Replies

1 Views

Last post by Anonymous
18 Oct 2025, 08:42
Finden Sie doppelte DMA mit zusätzlichem Speicherplatz in MySQL

Last post by Guest « 15 Jan 2025, 18:05
Posted in MySql

by Guest » 15 Jan 2025, 18:05 » in MySql

Ich habe die folgende Abfrage versucht, konnte aber kein Duplikat identifizieren.
select distinct dma,
replace(dma, ' ', '_') as market
from table_name
group by dma;

Aber bei Verwendung der...

0 Replies

23 Views

Last post by Guest
15 Jan 2025, 18:05
Tkinter ändert die Größe beim Hinzufügen von Matplotlib zum Reserve -Speicherplatz

Last post by Anonymous « 17 Mar 2025, 14:49
Posted in Python

by Anonymous » 17 Mar 2025, 14:49 » in Python

Ich habe eine GUI mit einem leeren tk.canvas widget, das ich während der Laufzeit mit einem Matplotlib -Plot füllen möchte. /> MWE:
import matplotlib as mpl
mpl.use('TkAgg')

import tkinter as tk...

0 Replies

9 Views

Last post by Anonymous
17 Mar 2025, 14:49
In der Druckvorschau wird zusätzlichen Speicherplatz für
,
,
-Tag in der Print -Vorschau hinzugefügt

Last post by Anonymous « 15 May 2025, 05:17
Posted in CSS

by Anonymous » 15 May 2025, 05:17 » in CSS

Ich versuche, eine Rechnung zu generieren und sie mithilfe der Druckschaltfläche zu drucken. Dies ist eine Druckvorschau und zusätzlichen White -Space wird vor hinzugefügt, bevor und nach wie im Bild...

0 Replies

14 Views

Last post by Anonymous
15 May 2025, 05:17

Return to “Python”