La Red de Conocimientos Pedagógicos - Aprendizaje de inglés - Los conjuntos de caracteres chinos más utilizados incluyen

Los conjuntos de caracteres chinos más utilizados incluyen

Los conjuntos de caracteres chinos de uso común incluyen: GB 2312; GB18030.

Texto es el término general para varios caracteres y símbolos, incluidos caracteres nacionales, signos de puntuación, símbolos gráficos, números, etc. Un juego de caracteres es una colección de varios caracteres. Hay muchos tipos de juegos de caracteres, cada uno de los cuales contiene un número diferente de caracteres. Los nombres de juegos de caracteres comunes incluyen el juego de caracteres ASCII, el juego de caracteres GB2312, el juego de caracteres BIG5, el juego de caracteres GB18030, el juego de caracteres Unicode, etc.

Para poder manejar con precisión varios conjuntos de caracteres, la computadora necesita codificar los caracteres para que pueda reconocer y almacenar varios caracteres. Existe una gran cantidad de caracteres chinos, divididos en caracteres simplificados y caracteres tradicionales, con diferentes reglas de escritura. Las computadoras fueron diseñadas originalmente para caracteres ingleses de un solo byte. Por lo tanto, la codificación de caracteres chinos es la base técnica para el intercambio de información china.

GB2312, también conocido como conjunto de caracteres GB2312-80, el nombre completo es "Conjunto básico de codificación de caracteres chinos para el intercambio de información", que fue publicado por la antigua Administración Estatal de Estándares e implementado en mayo de 1981.

El nombre completo de GB18030 es GB18030-2000 "Extensión del conjunto básico de conjuntos de caracteres de codificación de caracteres chinos para el intercambio de información", que es un nuevo estándar nacional para la codificación de caracteres chinos publicado por el gobierno chino en marzo. 17, 2000. El software lanzado en el mercado chino después del 31 de agosto de 2006 debe cumplir con este estándar.

Características de GB2312 y GB18030:

GB2312 es el conjunto de caracteres chinos simplificados estándar nacional de China. Sus caracteres chinos han cubierto el 99,75% de las frecuencias de uso, satisfaciendo básicamente las necesidades de las computadoras para procesar caracteres chinos. Se utiliza ampliamente en China continental y Singapur. GB2312 contiene 7445 caracteres simplificados y símbolos comunes, números de serie, números, letras latinas, kana japonesa, letras griegas, letras rusas, símbolos fonéticos chinos y letras pinyin chinas.

Incluye 6763 caracteres chinos, incluidos 3755 caracteres chinos de primer nivel y 3008 caracteres chinos de segundo nivel; incluidas letras latinas, letras griegas, letras japonesas hiragana y katakana y letras cirílicas rusas.

Después de una amplia participación y demostración, el estándar de juego de caracteres GB18030 fue implementado conjuntamente por reconocidas empresas de tecnología de la información nacionales y extranjeras, el Ministerio de Industria de la Información y la antigua Administración Estatal de Calidad y Supervisión Técnica. El estándar de juego de caracteres GB18030 resuelve el problema de la codificación informática de grandes conjuntos de caracteres compuestos por caracteres chinos, kana japonés, coreano y lenguas minoritarias chinas. El espacio de codificación total de este estándar supera los 654,38+0,5 millones de puntos de código, incluidos 27484 caracteres chinos, que abarcan el chino, el japonés, el coreano y los idiomas minoritarios chinos.

Cumple con los requisitos de formato de codificación unificada, multilingüe, de caracteres grandes y multiuso para el intercambio de información en China continental, Hong Kong, la provincia de Taiwán, Japón y Corea del Sur. También es compatible con Unicode versión 3.0 y completa el vocabulario de caracteres extendido Unicode "Extensión de caracteres chinos unificados A". Y es compatible con los estándares nacionales de codificación de caracteres anteriores (GB2312, GB13000.1).