La Red de Conocimientos Pedagógicos - Aprendizaje de inglés - ¿Cuáles son las codificaciones de caracteres chinos más utilizadas?

¿Cuáles son las codificaciones de caracteres chinos más utilizadas?

Los códigos informáticos de uso común incluyen: código ASCII, código de caracteres chinos, etc.

La codificación de caracteres utiliza números binarios para corresponder a los caracteres del conjunto de caracteres. El juego de caracteres más utilizado en la actualidad es ANSI, y la codificación binaria correspondiente al juego de caracteres ANSI se denomina código ANSI. Tanto los sistemas DOS como Windows utilizan códigos ANSI, pero la codificación de caracteres utilizada por el sistema se denomina código interno del sistema después de la conversión binaria. ? 1. Código interno de caracteres chinos: el código ANSI es un conjunto de codificación de un solo byte (número binario de 8 bits), que solo puede representar un máximo de 256 caracteres y no puede representar muchos caracteres chinos. Varios países y regiones han diseñado varios conjuntos de codificación de caracteres chinos basados ​​en códigos ANSI para manejar una gran cantidad de caracteres chinos. Estos códigos utilizan bytes únicos para representar caracteres ingleses ANSI (es decir, códigos compatibles con ANSI) y bytes dobles para representar caracteres chinos. Dado que un sistema solo puede tener un código interno de caracteres chinos, no puede reconocer caracteres en otros códigos internos de caracteres chinos, lo que genera inconvenientes en la comunicación. ? 2. Código GB: el código GB es un esquema de codificación de caracteres chinos simplificado anunciado por el país en 1980. Se utiliza ampliamente en China continental y Singapur. También se le denomina código estándar nacional. El código estándar nacional codifica un conjunto de 6763 caracteres chinos, que cubren la mayoría de los caracteres chinos en uso. ? 3.Código GBK: el código GBK es un código de caracteres extendido del código GB, que codifica más de 20.000 caracteres chinos simplificados y tradicionales. Las versiones simplificadas de Win95 y Win98 utilizan GBK como código interno del sistema. 4.Código BIG5: El código BIG5 es un código de caracteres chinos para caracteres chinos tradicionales, que se utiliza actualmente en sistemas informáticos en la provincia de Taiwán y Hong Kong. 5.Código HZ: el código HZ es una codificación de caracteres chinos ampliamente utilizada en Internet. ? 6. Codificación ISO-2022 CJK: IOS-2022 es un estándar de codificación desarrollado por la Organización Internacional de Normalización (ISO) para varios caracteres de idiomas. Se utiliza codificación de doble byte, donde la codificación china se denomina ISO-2022 CN y las codificaciones japonesa y coreana se denominan JP y KR respectivamente. En términos generales, estos tres se denominan colectivamente códigos CJK. Actualmente, los códigos CJK se utilizan principalmente en Internet. ? 7. Codificación Unicode: la codificación Unicode también es una codificación estándar internacional, utiliza codificación de doble byte y es incompatible con la codificación ANSI. Se ha utilizado en redes, sistemas Windows y muchos software de gran escala.