Page 1 of 1

Holen Sie sich alle kyrillischen Zeichen mit jeder Art von Akzent/Diakritik (Python)

Posted: 05 Mar 2025, 10:07
by Anonymous
Angesichts einer Saite müssen Sie jeden möglichen kyrillischen akzentuierten Charakter oder jeden kyrillischen Charakter mit Diakthon mit DiAkitik erhalten. Scheint eine leichte Aufgabe zu sein, aber bisher gibt es immer etwas, das nicht funktioniert. Gibt es ein einfacheres, um es zu tun? Unten finden Sie ein Beispiel für einige der Zeichen (funktioniert nicht richtig).

Code: Select all

import unicodedata

# Define Cyrillic Unicode ranges
cyrillic_ranges = [
(0x0400, 0x04FF),  # Cyrillic
(0x0500, 0x052F),  # Cyrillic Supplement
(0x2DE0, 0x2DFF),  # Cyrillic Extended-A
(0xA640, 0xA69F),  # Cyrillic Extended-B
(0x1C80, 0x1C8F),  # Cyrillic Extended-C
(0x1E030, 0x1E08F),  # Cyrillic Extended-D
(0x1D2B, 0x1D2B),  # Phonetic Extension (ᴫ)
(0x1D78, 0x1D78)   # Phonetic Extension (ᵸ)
]

diacritics = {
0x0300, 0x0301, 0x0303, 0x0304, 0x0306, 0x0307, 0x0308, 0x030A,
0x030B, 0x030C, 0x030F, 0x0311, 0x0323, 0x0328, 0x0331, 0x033E
}

def is_cyrillic_with_diacritic(char):
char_code = ord(char)
if any(start