Parsingdaten aus Zeichenfolgen, die nicht verwandten Text enthalten und gleichzeitig die Analyse von Ganzzahlen als Datu
Posted: 27 Mar 2025, 15:47
Was ich erreichen möchte < /strong>
Mein Ziel ist es, ein Datum zu extrahieren, das zumindest < /strong> einen Tag und einen Monat hat, aber auch eine Minute, Stunde und ein Jahr haben könnte. Finden Sie ein Datum, das nur ein kleiner Teil einer größeren Zeichenfolge ist. Derzeit im März)
Was ich bisher versucht habe.
Verwenden Sie die Einstellung für erforderliche Daten in DateParser
Es wäre großartig, wenn ich das Fuzzy = True Argument aus dem DateUtils -Modul mit dem Argument der Einstellungen aus dem DateParser -Modul kombinieren könnte, aber da sie als Abschlüsse sind, ist das nicht machbar.>
Mein Ziel ist es, ein Datum zu extrahieren, das zumindest < /strong> einen Tag und einen Monat hat, aber auch eine Minute, Stunde und ein Jahr haben könnte. Finden Sie ein Datum, das nur ein kleiner Teil einer größeren Zeichenfolge ist. Derzeit im März)
Was ich bisher versucht habe.
Code: Select all
from dateutil import parser
#OK: Correct Datetime is returned: datetime.datetime(2025, 3, 30, 0, 0)
parser.parse('Today is the most wonderful 30th March 2025', fuzzy=True)
#NOT OK: Integer is not ignored, Datetime is returned: datetime.datetime(2025, 3, 2, 0, 0)
parser.parse('2 is my lucky number', fuzzy=True)
Code: Select all
frome dateparser import parse
# OK: Returns correct datetime: datetime.datetime(2025, 3, 30, 0, 0
parse('30 March', settings={'REQUIRE_PARTS': ['month', 'day']})
#OK: Integer is Ignored, no datetime returned
parse('30', settings={'REQUIRE_PARTS': ['month', 'day']})
#NOT OK: Datetime Should be Found
parse('Today is the most wonderful 30th of March', settings={'REQUIRE_PARTS': ['month', 'day']})