Universal Transformation Format 8

Algorithme utilisé par Up ! Natural Language Support

L'algorithme Universal Transformation Format 8 (UTF-8) de l'Internet Engineering Task Force (IETF) permet d'encoder les caractères Unicode tout en étant compatible avec la table Ascii.

Ainsi :

Voici l'encodage :

Code UnicodeMasque de bitsEncodage UFT-8
0x00000xxxxxxx0x00
.........
0x007F0xxxxxxx0x7F
0x0080110xxxxx 10xxxxxx0xC100
.........
0x07FF110xxxxx 10xxxxxx0xDFBF
0x08001110xxxx 10xxxxxx 10xxxxxx0xD08480
.........
0xFFFF1110xxxx 10xxxxxx 10xxxxxx0xDFBFBF