Encodings von Zeichenketten

Die oben genannten Funktionen zur String-Ausgabe funktionieren leider nur bei Encodings für Sprachen, in welchen Präsentationen von einem Byte pro Buchstaben genutzt werden können, wie beispielsweise dem Deutschen, wo der Zeichensatz für lateinische Sprachen genutzt wird. Im Chinesischen ist es leider nicht möglich, ein Byte pro Buchstaben zu verwenden, da zu viele Buchstaben existieren. Um solche Strings trotzdem verarbeiten zu können, ist eine neue Familie von Funktionen hinzugekommen, die Multibyte-Stringfunktionen, die mit dem Prefix mb_ starten. So kann hier beispielsweise mb_strlen(), mb_strpos() oder mb_split() genutzt werden. Diese Ersetzung durch eine andere Funktion muss übrigens auch leider für die auf der kommenden Seite beschriebenen regulären Ausdrücke durchgeführt werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert