Presidio mit Langchain Experimental erkennt keine polnischen NamenPython

Python-Programme
Anonymous
 Presidio mit Langchain Experimental erkennt keine polnischen Namen

Post by Anonymous »

Ich verwende Presidio/Langchain_experimental, um Text in Polnisch zu anonymisieren, aber es erkennt keine Namen (z. B. "Jan Kowalski"). Hier ist mein Code: < /p>

Code: Select all

from presidio_anonymizer import PresidioAnonymizer
from presidio_reversible_anonymizer import PresidioReversibleAnonymizer

config = {
"nlp_engine_name": "spacy",
"models": [{"lang_code": "pl", "model_name": "pl_core_news_lg"}],
}

anonymizer = PresidioAnonymizer(analyzed_fields=["PERSON", "PHONE_NUMBER", "EMAIL_ADDRESS"],
languages_config=config)

anonymizer_tool = PresidioReversibleAnonymizer(analyzed_fields=["PERSON", "PHONE_NUMBER", "EMAIL_ADDRESS"],
languages_config=config)

text = "Jan Kowalski mieszka w Warszawie i ma e-mail jan.kowalski@example.com."

anonymized_result = anonymizer_tool.anonymize(text)
anon_result = anonymizer.anonymize(text)
deanonymized_result = anonymizer_tool.deanonymize(anonymized_result)

print("Anonymized text:", anonymized_result)
print("Deanonymized text:", deanonymized_result)
print("Map:", anonymizer_tool.deanonymizer_mapping)
print("Anonymized text:", anon_result)
< /code>
Ausgabe: < /p>
Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail jan.kowalski@example.com.
Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail jan.kowalski@example.com.
Map: {}
Anonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail jan.kowalski@example.com.
< /code>
Ich habe erwartet, dass der Name "Jan Kowalski" und die E -Mail -Adresse anonymisiert werden, aber die Ausgabe bleibt unverändert.python -m spacy download pl_core_news_lg
< /code>
Fehlt mir etwas in der Konfiguration oder unterstützt Presidio keine polnische Entitätserkennung ordnungsgemäß?anonymizer_tool = PresidioReversibleAnonymizer()
< /code>
Dann sieht die Ausgabe so aus: < /p>
Anonymized text: Elizabeth Tate mieszka w Warszawie i ma e-mail christinemurray@example.net.
Deanonymized text: Jan Kowalski mieszka w Warszawie i ma e-mail jan.kowalski@example.com.
Map: {'PERSON': {'Elizabeth Tate': 'Jan Kowalski'}, 'EMAIL_ADDRESS': {'christinemurray@example.net': 'jan.kowalski@example.com'}}

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post