Ich muss kyrillisch (und nur kyrillisch) mit Diakritik (alle Arten) identifizieren. These include:
Any Unicode code points that represents a Cyrillic letter immediately followed by any of the following diacritic marks:
̀0300 COMBINING GRAVE ACCENT
0301 COMBINING ACUTE ACCENT
0303 COMBINING Tilde < /li>
0304 Kombinieren Sie Makron < /li>
0306 Kombinieren Sie Breve < /li>
0307 Kombinieren Sie DOT über < /li>
0308 Kombinieren Sie die Diarese < /li>
030a -concining -Kombinierung von Klingeln. Akzent
[*]Any Unicode code point that represents a Cyrillic letter that can be decomposed into a base letter and a combining mark
The code I have works Ganz gut, außer dass es keine kombinierten Zeichen erfasst (erste Gruppe in der Testzeichenfolge, ist ́́ aus irgendeinem Grund keinen Akzent angezeigt). < /p>
Ich muss kyrillisch (und nur kyrillisch) mit Diakritik (alle Arten) identifizieren. These include: [list] [*]Any Unicode code points that represents a Cyrillic letter immediately followed by any of the following diacritic marks:
̀0300 COMBINING GRAVE ACCENT [*]0301 COMBINING ACUTE ACCENT [*]0303 COMBINING Tilde < /li> 0304 Kombinieren Sie Makron < /li> 0306 Kombinieren Sie Breve < /li> 0307 Kombinieren Sie DOT über < /li> 0308 Kombinieren Sie die Diarese < /li> 030a -concining -Kombinierung von Klingeln. Akzent [*] 030c kombiniert Caron [*] 030f Kombination Doppelgravenakzent />0331 COMBINING MACRON BELOW [*]033E COMBINING VERTICAL TILDE [/list]
[*]Any Unicode code point that represents a Cyrillic letter that can be decomposed into a base letter and a combining mark
The code I have works Ganz gut, außer dass es keine kombinierten Zeichen erfasst (erste Gruppe in der Testzeichenfolge, ist ́́ aus irgendeinem Grund keinen Akzent angezeigt). < /p> [code]import unicodedata
Angesichts einer Saite müssen Sie jeden möglichen kyrillischen akzentuierten Charakter oder jeden kyrillischen Charakter mit Diakthon mit DiAkitik erhalten. Scheint eine leichte Aufgabe zu sein, aber...
Ich habe also eine riesige Datenbank mit arabisch geschriebenem Text mit Diakritik (Diakritika sind kleine Zeichen auf Arabisch, die an andere Zeichen verbunden sind)
Ich habe einen riesigen Datenrahmen mit Millionen von Zeilen und IDs. Meine Daten sehen so aus:
Time ID X Y
8:00 A 23 100
9:00 B 24 110
10:00 B 25 120
11:00 C 26 130
12:00 C 27 140
13:00 A 28 150...
Verwenden von Alembic -Aktualisierung eines Enum -Typs Ich fand mich blockiert, da die Datamigration die enum neuen Werte ohne Commit zwischen den Dateien nicht verwenden wollte. (alembic upgrade +1...
Ich verwende das Open XML SDK, um eine Excel -Datei zu öffnen, um die Zellwerte aus allen Zeilen und Spalten abzurufen, die Daten im Arbeitsblatt enthalten. Hier ist mein Code: