Page 1 of 1

Regulärer Ausdruck, um die Zeichenfolgendarstellung von Nicht-ASCII-Zeichen \u0000-\u007F aus einer Zeichenfolge abzugle

Posted: 16 Jan 2025, 11:40
by Guest
Ich erhalte eine hexadezimale Darstellung von Unicode-Zeichen in meiner Zeichenfolge und möchte diese durch eine leere Zeichenfolge ersetzen. Genauer gesagt, der Versuch, alle Werte innerhalb \u0000-\u007F in einer Zeichenfolge mithilfe von Regex abzugleichen, um sie durch eine leere Zeichenfolge mit C# zu ersetzen.
Beispiel 1:< /p>
InputString: "\u007FTestString"
ExpectedResult: TestString
Beispiel 2:
InputString: "\u007FTestString\U0000"
ExpectedResult: TestString
Meine aktuelle Lösung funktioniert

Code: Select all

            if (!string.IsNullOrWhiteSpace(testString))
{
return Regex.Replace(testString, @"[^\u0000-\u007F]", string.Empty);
}
stimmt nicht mit der hexadezimalen Darstellung des Nicht-ASCII-Zeichens überein. Wie kann ich dafür sorgen, dass es mit \u0000-\u007F in der Zeichenfolge übereinstimmt?
Jede Hilfe ist willkommen. Danke!