Ich verwende Presidio/Langchain_experimental, um Text in Polnisch zu anonymisieren, aber es erkennt keine Namen (z. B. "Jan Kowalski"). Hier ist mein Code: < /p>
from presidio_anonymizer import PresidioAnonymizer
from presidio_reversible_anonymizer import PresidioReversibleAnonymizer
config = {
"nlp_engine_name": "spacy",
"models": [{"lang_code": "pl", "model_name": "pl_core_news_lg"}],
}
anonymizer = PresidioAnonymizer(analyzed_fields=["PERSON", "PHONE_NUMBER", "EMAIL_ADDRESS"],
languages_config=config)
anonymizer_tool = PresidioReversibleAnonymizer(analyzed_fields=["PERSON", "PHONE_NUMBER", "EMAIL_ADDRESS"],
languages_config=config)
text = "Jan Kowalski mieszka w Warszawie i ma e-mail [email protected]."
anonymized_result = anonymizer_tool.anonymize(text)
anon_result = anonymizer.anonymize(text)
deanonymized_result = anonymizer_tool.deanonymize(anonymized_result)
print("Anonymized text:", anonymized_result)
print("Deanonymized text:", deanonymized_result)
print("Map:", anonymizer_tool.deanonymizer_mapping)
print("Anonymized text:", anon_result)
< /code>
Ausgabe: < /p>
Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected].
Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected].
Map: {}
Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected].
< /code>
Ich habe erwartet, dass der Name "Jan Kowalski" und die E -Mail -Adresse anonymisiert werden, aber die Ausgabe bleibt unverändert.python -m spacy download pl_core_news_lg
< /code>
Fehlt mir etwas in der Konfiguration oder unterstützt Presidio keine polnische Entitätserkennung ordnungsgemäß?anonymizer_tool = PresidioReversibleAnonymizer()
< /code>
Dann sieht die Ausgabe so aus: < /p>
Anonymized text: Elizabeth Tate mieszka w Warszawie i ma e-mail [email protected].
Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected].
Map: {'PERSON': {'Elizabeth Tate': 'Jan Kowalski'}, 'EMAIL_ADDRESS': {'[email protected]': '[email protected]'}}
Ich verwende Presidio/Langchain_experimental, um Text in Polnisch zu anonymisieren, aber es erkennt keine Namen (z. B. "Jan Kowalski"). Hier ist mein Code: < /p> [code]from presidio_anonymizer import PresidioAnonymizer from presidio_reversible_anonymizer import PresidioReversibleAnonymizer
print("Anonymized text:", anonymized_result) print("Deanonymized text:", deanonymized_result) print("Map:", anonymizer_tool.deanonymizer_mapping) print("Anonymized text:", anon_result) < /code> Ausgabe: < /p> Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected]. Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected]. Map: {} Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected]. < /code> Ich habe erwartet, dass der Name "Jan Kowalski" und die E -Mail -Adresse anonymisiert werden, aber die Ausgabe bleibt unverändert.python -m spacy download pl_core_news_lg < /code> Fehlt mir etwas in der Konfiguration oder unterstützt Presidio keine polnische Entitätserkennung ordnungsgemäß?anonymizer_tool = PresidioReversibleAnonymizer() < /code> Dann sieht die Ausgabe so aus: < /p> Anonymized text: Elizabeth Tate mieszka w Warszawie i ma e-mail [email protected]. Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail [email protected]. Map: {'PERSON': {'Elizabeth Tate': 'Jan Kowalski'}, 'EMAIL_ADDRESS': {'[email protected]': '[email protected]'}} [/code]
Ich verwende Presidio/Langchain_experimental, um Text in Polnisch zu anonymisieren, aber es erkennt keine Namen (z. B. Jan Kowalski ). Hier ist mein Code:
from presidio_anonymizer import...
Ich habe mein eigenes Paket mit -E 'Git+https: // ....@main#egg=package' installiert. Ich baue meine Abhängigkeiten mit Pip-Tools (PIP-Compile) und installiere sie mit PIP-Sync. Es wird jedoch nicht...
Ich baue ein QA-System auf rappenbasiertem Dokument mit Python (no Langchain), Lama (50K-Kontext), PostgreSQL mit PGVector und Docling for Parsing. Benutzer können bis zu 10 große Dokumente hochladen...