UTF-16 (16- bit Unicode Transformation Format)

L'UTF-16 (16 bit Unicode Transformation format) est une norme industrielle pour l'encodage des données en caractères Unicode. L'UTF-16 fait partie de la norme Unicode version 3.0 et des versions supérieures. Il peut encoder tous les caractères Unicode actuellement utilisés. L'UTF-16 se trouve dans l'Annexe Q de la norme ISO/IEC 10646 et dans la RFC2781 de l'IETF.

Unicode est conçu pour s'adapter à tous les systèmes d'écriture connus dans le monde. Le système Unicode utilise trois codes différents pour présenter les jeux de caractères Unicode. Il s'agit de UTF-8 (UTF-16), UTF-32 et UTF-32. Chaque codage définit un système dans lequel les caractères d'un jeu de caractères peuvent être stockés au format binaire dans un fichier. Un point de code est une représentation binaire de tout caractère. Unicode peut définir plus d'un million d'encodages distincts (10FFFF points de code en hexadécimal ; 1 114 112 en décimal). Les points de code Unicode sont divisés en 17 plans, dont les plans 0 à 2 sont les plus courants : le plan 0, également connu sous le nom de Plan de base multilingue (BMP), contient à la fois les caractères de la plupart des langues modernes et certains des caractères spéciaux les plus courants. Le plan 1, appelé plan multilingue supplémentaire (SMP), est utilisé principalement pour les écritures historiques telles que le Linéaire B et pour les symboles musicaux et mathématiques. Le plan 2, appelé plan idéographique supplémentaire (SIP), est utilisé pour environ 40 000 idéogrammes Han unifiés rarement utilisés dans les communications écrites quotidiennes. À l'heure actuelle, les autres plans restent largement inutilisés. L'UTF-16 encode les caractères dans des séquences binaires spécifiques en utilisant une ou deux séquences de 16 bits. Il existe trois types de méthodes d'encodage qui transforment les points de code en séquences de 8 bits et d'octets. Ces méthodes sont toutes des variations du modèle de séquence de base de 16 bits. L'UTF-16 est parfois utilisé de manière interchangeable avec l'UCS-2, bien que cette utilisation ne soit pas strictement correcte.

Vous pouvez également être intéressé
  1. Format de transformation unicode (utf) Définition - Que signifie le format de transformation Unicode (UTF)? Le format de transformation Unicode (UTF) est un format de codage de caractères qui est capable de coder tous les points de code de caractères possibles en Unicode. Le plus prolifique est UTF-8, qui est un codage de longueur variable...
  2. Format de transformation Unicode 8 bits (utf-8) Définition - Que signifie le format de transformation Unicode 8 bits (UTF-8)? Le format de transformation Unicode 8 bits (UTF-8) est une convention de code relativement nouvelle pour le codage de divers caractères. C'est une norme pour l'identité des caractères et une référence pour une grande variété de langages de...

  1. Transformation numérique Définition - Que signifie la transformation numérique? La transformation numérique est les changements associés à l'application et à l'intégration de la technologie numérique dans tous les aspects de la vie humaine et de la société. C'est le passage du physique au numérique. Definir Tech explique la transformation numérique La transformation...
  2. Transformation du centre de données Définition - Que signifie la transformation du centre de données? La transformation d'un centre de données est le processus de modification d'un centre de données pour améliorer ses fonctionnalités et ses performances globales. Certains experts définissent et caractérisent la transformation des centres de données comme des programmes de changement à...