Gibt es eine Möglichkeit, diesen langsamen regulären Ausdruck zu beschleunigen oder durch eine andere Lösung zu ersetzen

Gibt es eine Möglichkeit, diesen langsamen regulären Ausdruck zu beschleunigen oder durch eine andere Lösung zu ersetzen ⇐ Python

1 post • Page 1 of 1

Anonymous

Gibt es eine Möglichkeit, diesen langsamen regulären Ausdruck zu beschleunigen oder durch eine andere Lösung zu ersetzen

Post by Anonymous » 27 Feb 2025, 07:21

Ich habe einen regulären Ausdruck, aber es funktioniert sehr langsam, wenn es auf eine große Anzahl von Räumen im Text stößt. Gibt es eine Möglichkeit, ihn zu beschleunigen?

Code: Select all

import re

split_by_dot_pattern = r"(?|-(?=\s*\w+))"
split_by_tag_pattern = r"|(?)[\s+\n+]\s*(?=|)|[….?!](?=|
)"

sentence_split_pattern = split_by_dot_pattern + split_by_tag_pattern
sentence_split_regexp = re.compile(sentence_split_pattern)

def split_text_into_part(text, part_regexp):
"""
:rtype: list[dict]
"""
initial_position = 0
parts = []

for match in part_regexp.finditer(text):
start, end = match.span()
parts.append({'left': initial_position, 'length': start - initial_position, 'text': text[initial_position:start]})
initial_position = end

parts.append({'left': initial_position, 'length': len(text) - initial_position, 'text': text[initial_position:]})

return parts

example_text = " " * 10000 + " Show Image " + " " * 10000

print(split_text_into_part(example_text, sentence_split_regexp))

1740637274

Anonymous

Ich habe einen regulären Ausdruck, aber es funktioniert sehr langsam, wenn es auf eine große Anzahl von Räumen im Text stößt. Gibt es eine Möglichkeit, ihn zu beschleunigen?[code]import re

split_by_dot_pattern = r"(?|-(?=\s*\w+))"
split_by_tag_pattern = r"|(?)[\s+\n+]\s*(?=|)|[….?!](?=|
)"

sentence_split_pattern = split_by_dot_pattern + split_by_tag_pattern
sentence_split_regexp = re.compile(sentence_split_pattern)

def split_text_into_part(text, part_regexp):
"""
:rtype: list[dict]
"""
initial_position = 0
parts = []

for match in part_regexp.finditer(text):
start, end = match.span()
parts.append({'left': initial_position, 'length': start - initial_position, 'text': text[initial_position:start]})
initial_position = end

parts.append({'left': initial_position, 'length': len(text) - initial_position, 'text': text[initial_position:]})

return parts

example_text = " " * 10000 + " Show Image " + " " * 10000

print(split_text_into_part(example_text, sentence_split_regexp))
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Gibt es eine Möglichkeit, diesen langsamen regulären Ausdruck zu beschleunigen oder durch eine andere Lösung zu ersetzen

Last post by Anonymous « 27 Feb 2025, 05:54
Posted in Python

by Anonymous » 27 Feb 2025, 05:54 » in Python

Ich habe einen regulären Ausdruck, aber es funktioniert sehr langsam, wenn es auf eine große Anzahl von Räumen im Text stößt. Gibt es eine Möglichkeit, ihn zu beschleunigen? import re...

0 Replies

6 Views

Last post by Anonymous
27 Feb 2025, 05:54
Beschleunigen Sie Google Apps Script mit langsamen Gmail-Nachrichteninteraktionen

Last post by Anonymous « 17 Jan 2025, 09:59
Posted in JavaScript

by Anonymous » 17 Jan 2025, 09:59 » in JavaScript

Der App-Skript-API-Aufruf von Gmail zum Abrufen der Nachrichten eines Threads dauert besonders lange (Zeitablauf unten dargestellt), daher suche ich nach einer Möglichkeit, jeden Aufruf im...

0 Replies

14 Views

Last post by Anonymous
17 Jan 2025, 09:59
Azure AD B2C: Susi-Benutzerfluss-Layoutfehler: Ungültiges Zeichen in der Klasse im regulären Ausdruck

Last post by Guest « 15 Jan 2025, 17:57
Posted in HTML

by Guest » 15 Jan 2025, 17:57 » in HTML

Ich verwende Azure B2C mit Standard-SUSI-Benutzerfluss.
Die Seitenlayoutversion ist 2.17.
Wir verwenden benutzerdefiniertes HTML Seite, aber ich glaube nicht, dass das Problem damit zusammenhängt....

0 Replies

8 Views

Last post by Guest
15 Jan 2025, 17:57
Mein neuronales Netzwerk versucht, eine faule Lösung anstelle der optimalen Lösung zu finden, um einen Mittelwert zu fin

Last post by Anonymous « 14 Apr 2025, 02:02
Posted in Python

by Anonymous » 14 Apr 2025, 02:02 » in Python

Dies ist ein neuronales Netzwerk, das ich versuchte, ich bin nicht allzu sicher über meinen Backpropogation, aber es scheint mindestens Antworten zu konvergieren, obwohl es bei 4 Zahlen und der...

0 Replies

13 Views

Last post by Anonymous
14 Apr 2025, 02:02
Gibt es eine Möglichkeit, Inhalte durch Klicken auf einen Link zu ersetzen? [geschlossen]

Last post by Guest « 06 Jan 2025, 22:43
Posted in HTML

by Guest » 06 Jan 2025, 22:43 » in HTML

Ich bin völlig ratlos und es ist wirklich frustrierend.
Ich möchte dafür sorgen, dass sich beim Klicken auf einen bestimmten Link nur der darin enthaltene Inhalt ändert div, ohne die Seite neu zu...

0 Replies

13 Views

Last post by Guest
06 Jan 2025, 22:43

Return to “Python”