Wie berechnen Sie die Fraktion (gültige UTF8-Byte-Sequenz n)/(Gesamt-N-Byte-Sequenzen) effizient? [geschlossen]Python

Python-Programme
Anonymous
 Wie berechnen Sie die Fraktion (gültige UTF8-Byte-Sequenz n)/(Gesamt-N-Byte-Sequenzen) effizient? [geschlossen]

Post by Anonymous »

Dies wird ein langer Beitrag. Und es hat absolut nichts mit Hausaufgaben zu tun, ich bin nur neugierig, und das hat keine unmittelbaren praktischen Vorteile, aber das ist wie die Verfolgung der reinen Wissenschaft, Sie wissen nie, was Sie erhalten. Ich möchte eine unendlich genaue reduzierte Fraktion (die ich als ganzzahliges Paar (Zahlener, Nenner) ). Die Anzahl der gültigen UTF8 -Sequenzen ist jedoch schwieriger. Aber ich weiß, wie man es berechnet. />Code_Range
Byte_Length
Bit_Pattern
Data_Bits




U+0000..007F
1 Byte < /td>
0xxxxxxx < /td>
7 Bits < /td>
< /tr>

u+0080..07ff< /> 110xxxxx 10xxxxxx < /td>
11 Bits < /td>
< /tr>

U+0800..ffff
3 Bytes < /td>
10xxxxxx
16 bits


U+10000..10FFFF
4 bytes
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
21 Bits



jetzt UTF8-Codierung verwendet keine Code-Punkte in der Reichweite (0xd800, 0xe000) , die folgende Ausnahme in Python:

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post