La Red de Conocimientos Pedagógicos - Conocimientos para el examen de postgrado - ¿Cuál es el código de intercambio de información de caracteres chinos estándar nacional de China?

¿Cuál es el código de intercambio de información de caracteres chinos estándar nacional de China?

Código estándar nacional: ("Codificación de caracteres chinos estándar nacional para el intercambio de información" (estándar GB2312-80))

El código estándar nacional se refiere al código de caracteres chinos desarrollado en China en 1980. para un procesamiento diferente de caracteres chinos. Una codificación utilizada al intercambiar información de caracteres chinos entre sistemas informáticos funcionales. El código internacional es un código de dos bytes que utiliza dos números binarios de siete bits para representar un carácter chino. En la actualidad, el código estándar nacional contiene 6763 caracteres chinos, incluidos 3755 caracteres chinos de primer nivel (los más utilizados), 3008 caracteres chinos de segundo nivel y 682 caracteres e íconos occidentales. Los caracteres chinos de primer nivel son caracteres de uso común, ordenados en orden pinyin, y los caracteres chinos de segundo nivel son caracteres de uso menos común, ordenados por radicales. El rango del código estándar nacional es 2121H-7E7EH.

El código estándar nacional es un número hexadecimal de cuatro dígitos y el código de ubicación es un número decimal de cuatro dígitos. Cada código estándar nacional o código de ubicación corresponde a un carácter o símbolo chino único, pero porque el. hexadecimal Rara vez usamos números base, por lo que lo que comúnmente usamos es el código de área. Los dos primeros dígitos se llaman código de área y los dos últimos dígitos se llaman código de bits.

Código de área: todos los caracteres. en GB 2312-80 La colección forma una matriz cuadrada de 94 × 94. Cada fila se denomina "área" y está numerada del 0l al 94. Cada columna se denomina "bit" y está numerada del 0l al 94. , se obtiene el mapa de área de GB 2312-80. La codificación de caracteres chinos representada por la posición del mapa de bits del área se denomina código de área.

Código en la máquina: para evitar problemas de ambigüedad cuando se utilizan códigos ASCII y códigos estándar nacionales al mismo tiempo, la mayoría de los sistemas de caracteres chinos utilizan la posición alta 1 de cada byte del código estándar nacional como el código en la máquina para caracteres chinos. Esto no solo resuelve la ambigüedad entre el código de máquina de caracteres chinos y el código de máquina occidental, sino que también hace que el código de máquina de caracteres chinos y el código estándar nacional tengan una relación de correspondencia muy simple.

Código de intercambio de caracteres chinos: un código unificado especificado para cada carácter chino al transmitir información entre sistemas de procesamiento de información de caracteres chinos o sistemas de comunicación. Nuestro país ha designado el estándar nacional para códigos de intercambio de caracteres chinos "Codificación de caracteres chinos para". intercambio de información" Juego de caracteres - juego básico", cuyo nombre en código es GB 2312-80, también conocido como "código estándar nacional".

La relación entre el código interno de caracteres chinos, el código estándar nacional y el código de ubicación:

Los dos bytes del código de ubicación (decimal) se convierten a hexadecimal y luego se agregan 20H. para obtener el código estándar nacional correspondiente, el código en la máquina es el bit más alto de los dos bytes del código de intercambio de caracteres chinos (código estándar nacional) más 1 respectivamente, es decir, los dos bytes del código de intercambio de caracteres chinos (nacional). código estándar) se agregan a 80H para obtener el código de código de máquina correspondiente; los dos bytes del código de área (decimal) se convierten a hexadecimal y luego se agrega A0H para obtener el código interno correspondiente.

(1) El código de ubicación se convierte primero a una representación hexadecimal

(2) Código estándar nacional = representación hexadecimal del código de ubicación + 2020H

( 3) Código interno = código estándar nacional + 8080H = código de área A0A0H

Ejemplo:

Tome el carácter chino "大" como ejemplo, el código de área del carácter "大" es 2083

1. El código de área es 20 y el número de bit es 83

2. Convierta el número de área 2083 a hexadecimal y represéntelo como 1453H

3. 1453H+2020H=3473H, obtenga el código estándar nacional 3473H

4. 3473H+8080H=B4F3H, obtenga el código en la cámara B4F3H