Code: Select all
def only_transform_backslash_u(content):
new_content = b''
idx = 0
while idx < len(content):
if content[idx:idx+2] == b'\\u':
new_content += content[idx:idx+6].decode('unicode_escape').encode('utf-8')
idx += 6
else:
new_content += content[idx:idx+1]
idx += 1
return new_content
< /code>
Hier ist der Beispieleingang und die erwartete Ausgabe: < /p>
Eingabe < /p>
content = br'''\u25c6\u4e00\u53ea\n\u68d5\u8272\r\u7684\u72d0
\u72f8\u8df3\u8fc7\u4e00\u53ea\u61d2\u60f0\u7684\u72d7'''
< /code>
Ausgabe < /p>
new_content = br'''\xe2\x97\x86\xe4\xb8\x80\xe5\x8f\xaa\n\xe6\xa3\x95\xe8\x89\xb2\r\xe7\x9a\x84\xe7\x8b\x90
\xe7\x8b\xb8\xe8\xb7\xb3\xe8\xbf\x87\xe4\xb8\x80\t\xe5\x8f\xaa\xe6\x87\x92\xe6\x83\xb0\xe7\x9a\x84\xe7\x8b\x97'''