¿Cuáles son las reglas de codificación para frases en fuente Wubi?
Reglas de codificación de un solo carácter de fuente Wubi
1. Consejos de codificación de fuente Wubi
Domina las reglas de codificación de los caracteres chinos y familiarízate con la codificación de cada carácter chino. La base de la entrada de texto, las reglas de codificación de fuentes de cinco trazos para un solo carácter, se proporcionan a continuación:
Las fuentes de cinco trazos son todas intuitivas y están codificadas según el orden de los trazos en chino; carácter cuatro veces para el nombre de la clave y consulte las raíces de los caracteres básicos. Cópielo.
Tome el cuarto código al final de uno, dos y tres y divida el orden para obtenerlo. prioridad si hay menos de cuatro códigos, preste atención, reconozca y complete el reverso.
A partir de esta fórmula, podemos ver la apariencia general de las reglas de codificación de las fuentes Wubi. Al mismo tiempo, la fórmula también resume los cinco principios para dividir caracteres y extraer códigos de las fuentes Wubi:
1. Desde la forma Elija el orden según las reglas de escritura, es decir, de izquierda a derecha, de arriba a abajo, de afuera hacia adentro
2. como unidad básica;
3. Para caracteres chinos con más de cuatro radicales, en el orden de los radicales uno, dos y último, solo se tomarán cuatro códigos como máximo. >4. La estructura única más grande se dividirá primero;
5. Identificación cruzada del último trazo y fuente.
La siguiente figura es el diagrama de flujo de codificación de fuentes Wubi para facilitar a los lectores la comprensión general de todo el esquema de codificación:
2 Reglas de codificación para caracteres chinos de nombres clave
.Wubi Hay 25 caracteres chinos con nombres clave especificados en la fuente, "Wang Tu Da Carpintero Muri Kou Tian Montaña Wo Bai Yue Ren Jin Yan Li Agua y Fuego Ya Niños y Di"
Hay 25 Nombre de clave Los caracteres chinos con claves de 25 letras se corresponden entre sí. La codificación de estas palabras es bastante simple. Su codificación son las cuatro letras de la clave de letras. Por ejemplo, la codificación del carácter "yan" es "YYYY". la codificación del carácter "纺" es "XXXX", etc. Al ingresar un carácter chino para el nombre de una clave, simplemente presione la tecla de la letra donde se encuentra el carácter cuatro veces seguidas.
3. Reglas de codificación para raíces de caracteres
En cada tecla de letra del teclado de fuente Wubi, además de un nombre de clave raíz, hay otros tipos de raíz. Algunos radicales son en sí mismos un carácter chino, y a esos radicales se les llama radicales Chengzi. La codificación de la raíz de un carácter se realiza según la siguiente fórmula:
Código de nombre de clave + código de primer trazo + código de segundo trazo + código de último trazo
Cuando la raíz de un carácter un carácter tiene solo dos trazos. En ese momento, la codificación solo tiene tres códigos y la fórmula es:
Código de nombre de clave + código de primer trazo + código de último trazo
Por ejemplo: "石", la tecla donde se encuentra la raíz es D, y la tecla El código para el primer trazo de "horizontal" es G, el código para el segundo trazo de "horizontal" es la tecla T, y el código para el El último trazo de "horizontal" también es la tecla G, por lo que el código Wubi de este carácter es DGTG. Otro ejemplo es la palabra "gusano". La raíz de este carácter está en la tecla J. El primer trazo es una H vertical, el segundo trazo es una N doblada y el último trazo es 捺 ("punto" se usa como ").捺" en Wubi) Y. Entonces, el código Wubi para "gusano" es JHNY.
4. Reglas de codificación para caracteres extranjeros clave
En el estándar nacional GB2312-80, hay más de cien caracteres clave, como los nombres clave y las raíces de palabras mencionados anteriormente. , la gran mayoría de los caracteres chinos no son radicales y estos son los que más utilizamos.
La codificación de caracteres chinos de la fuente Wubi es principalmente la codificación de caracteres extranjeros. La codificación se puede dividir en dos categorías, código raíz de caracteres puros y código de identificación. Si los radicales de un carácter chino son cuatro o más de cuatro, los tres primeros y el último se utilizarán para formar un código con un total de cuatro códigos radicales.
Los caracteres chinos con menos de cuatro radicales deben complementarse con un código de identificación de estructura de fuente para aumentar la cantidad de información para distinguir los caracteres chinos.
1. Código radical
A cada radical se le asigna una clave de letra, y el inglés de la clave es el "código raíz" del radical. Para cualquier carácter chino que contenga cuatro o más radicales, el primer, segundo, tercer y último código de cuatro radicales se utilizan para formar el código de entrada del carácter extranjero. El primer código raíz + el segundo código raíz + el tercer código raíz + el último código raíz Aquí el primero, segundo, tercero y último deben escribirse en el orden normal, primero a la izquierda, luego a la derecha, primero arriba y luego abajo, primero el exterior. Detrás del adentro.
2. Código de identificación cruzada
Cuando una palabra tiene menos de cuatro radicales, después de ingresar los códigos de radicales en secuencia, es necesario agregar un código de identificación al final. ¿Por qué se necesita este código de identificación? Aquí hay un ejemplo: por ejemplo, las palabras "Mu" y "Ting" se componen de dos radicales y los códigos raíz de estas dos palabras son IS.
Aunque el ingresador también puede elegir un método para determinar qué carácter debe ingresarse, esto es extremadamente perjudicial para la velocidad de entrada de los caracteres chinos. Cuanto menor sea la tasa de repetición del código, mejor. Por lo tanto, se introdujo el concepto de código de identificación en Wubi. codificación para resolver este problema. Clasificación de caracteres chinos.
El código de identificación está determinado por el último trazo del carácter chino y la información de la estructura de la fuente. Las reglas específicas son las siguientes:
Estructura izquierda y derecha (el primer dígito) Arriba. y estructura hacia abajo (el 2do dígito) ) Estructura híbrida (No. 3)
El último trazo es "horizontal", en la primera zona G F D
El último trazo es "vertical" , en la segunda área H J K
El último trazo es "捺", en la tercera área T R E
El último trazo es "捺", en la cuarta área Y U I
El último trazo es "Zhe", en la quinta área N B V
Como se puede ver en la tabla anterior, hay dos pasos para determinar el código de identificación. El primer paso es determinar qué área. se basa en el último trazo y el segundo paso es determinar en qué área se basa la estructura de fuente del carácter chino, y luego podrá obtener el código de identificación específico. Por ejemplo: "旮", este carácter tiene solo dos radicales como Xu. El código raíz es VJ, pero el tipo de fuente es diferente. El último trazo de "旮" es horizontal. primera área, tiene una estructura superior-inferior, por lo que está en la segunda posición, que es F, por lo que el código Wubi de "殮" es VJF. Otro ejemplo es la palabra "ting". El último trazo es el gancho vertical izquierdo, que es vertical en Wubi. En la segunda área, este carácter tiene una estructura de izquierda a derecha, por lo que está en primer lugar, que es H. entonces el código Wubi de "ting" es ISH.
Cuando el código de identificación aún sea inferior a cuatro, pulsa la barra espaciadora para finalizar. Las fuentes en las que un solo trazo se conecta a la raíz son tipos híbridos, como se mencionó anteriormente.
También existen las siguientes regulaciones respecto al último trazo, que hacen que la adquisición del código sea más sencilla y clara.
(1) Cuando la raíz del último carácter es "force", "dao", "jiu", "qi", etc., el último trazo siempre se considera zhe.
(2) Para palabras como "jin", "zheng" y "elegir", el último trazo de "caminar" no es el último trazo (de hecho, es el último trazo al escribir, pero de esta manera se reduce el último trazo. De manera similar, se reduce la cantidad de información de identificación. Se acuerda que los códigos de identificación de Jin, Zhizhi y Yuan deben construirse a partir del último trazo de todo el carácter después de eliminar la parte "Zou Zhi". 53, V. Cuando el último trazo es "Zu Zhi", el código de identificación es 43, I. No se obtiene información de identificación
(3), "I", "戋", tome. "丿" como el último trazo del carácter "成".
5. Códigos simples
Para mejorar la velocidad de entrada, el esquema de fuente Wubi también diseña la entrada de código simple. Los caracteres chinos que se usarán con frecuencia solo se componen de uno, dos o tres radicales delante de ellos. Debido a que el "código de identificación" siempre está en la última posición del código completo, el diseño del código corto no solo reduce el número. de pulsaciones de teclas, pero también elimina la necesidad de algunos caracteres chinos. La identificación y codificación de "códigos de identificación" aportan una gran comodidad a las pulsaciones de teclas.
Los caracteres chinos de código simple se dividen en tres niveles:
1. Código simple de primer nivel<. /p>
En la fuente Wubi, de acuerdo con las características morfológicas de la raíz de cada tecla, se organiza uno de los caracteres chinos de alta frecuencia más utilizados para cada tecla. Hay hasta 25 caracteres de este tipo y sus códigos son de solo un dígito. Al ingresar, simplemente presione la tecla una vez y luego presione la barra espaciadora nuevamente. Estas palabras de alta frecuencia y sus códigos son los siguientes:
<. p>一G地 F在D要 S 工A上HYes. J en K país L con M
R con T tiene E persona W I Q
Producto principal Y U no I para O este P
民N B, V, C, X
La memoria clave real de estas palabras de alta frecuencia se puede asociar con los nombres de las claves. Si miras más de cerca, puedes encontrar que hay dos palabras, cuyos códigos cortos de primer nivel La palabra y los nombres clave son los mismos.
La siguiente es una tabla comparativa de palabras de alta frecuencia y nombres clave:
La primera área: 1->Wangdi->Tuzai->Yao->Carpintería->Trabajo
Segunda Distrito: Shang->Mushi->Japón->Kouguo->Tian Tong->Shan
Tercer Distrito: He->He's->Baiyou->Yueren->人我->Oro
Cuarto Distrito: Señor->Propiedad de la Palabra->Establecimiento->Agua->Fuego->Zhi
Quinto Distrito: Gente->Se acabó ->Zifa->Nvyi->Youjing->纺
2. Código simple de segundo nivel
El código simple de segundo nivel se refiere a tomar los dos primeros caracteres del código completo al codificar el código raíz. Hay veinticinco códigos clave y la combinación de dos códigos tiene un total de 25*25=625 códigos. En otras palabras, se pueden codificar 625 caracteres chinos utilizando códigos de dos dígitos. La fuente Wubi selecciona más de 600 caracteres chinos de uso frecuente para corresponderlos, y estos códigos se convierten en abreviaturas de estos caracteres chinos.
3. Código simple de tres niveles
El código simple de tercer nivel consta de los tres primeros radicales de un carácter chino. codificado en todo el sistema de codificación Es único y generalmente se usa como un código corto de tres niveles. El número de códigos que pueden estar compuestos por tres letras es: 25*25*25=15625. De hecho, entre los 5.763 caracteres chinos del conjunto básico internacional, hay más de 4.400 caracteres chinos con abreviaturas de tres niveles. Para ingresar estos caracteres chinos, simplemente escriba estos tres códigos raíz en secuencia, seguidos de la barra espaciadora. De esta manera, parece que el número de pulsaciones de teclas sigue siendo de cuatro teclas y no se ha reducido. Sin embargo, dado que se omite la determinación de los radicales después de los tres primeros radicales o la determinación del código de reconocimiento cruzado, la velocidad de codificación puede reducirse. mejorar y, por lo tanto, se puede mejorar la velocidad de entrada.
En el esquema de codificación de fuentes Wubi, el número total de caracteres chinos con códigos simples alcanza más de 5.000 y representan la gran mayoría de los 5.763 caracteres del conjunto básico internacional. Por lo tanto, el uso de códigos cortos no solo hace que la codificación de la entrada sea muy concisa e intuitiva, sino que también mejora en gran medida la eficiencia de la entrada.
Por supuesto, dado que los códigos cortos son simplemente cuatro códigos, algunas palabras tendrán varios códigos cortos al mismo tiempo. Por ejemplo, la palabra "经" tiene un código simple de primer nivel, un código simple de segundo nivel y un código simple de tercer nivel. También se puede ingresar con cuatro dígitos. Por lo tanto, es mejor memorizar caracteres chinos con códigos abreviados. Para un carácter chino con varios códigos abreviados, es mejor utilizar la menor cantidad de pulsaciones de teclas posible, lo que puede mejorar la velocidad de entrada.
6. Códigos repetidos y códigos tolerantes a errores
Si un código corresponde a varios caracteres chinos, estos caracteres se denominan palabras de código repetido, y varios códigos corresponden a un carácter chino. Los códigos se llaman Es un código tolerante a errores para caracteres chinos.
En la fuente Wubi, cuando se ingresa un código repetido, la palabra codificada repetida se muestra en la línea de solicitud. Las palabras más utilizadas se clasifican en la primera posición y el número de serie del código repetido. La palabra se señala con un número. Si lo desea, es la primera palabra. Puede continuar ingresando la siguiente palabra y la palabra saltará automáticamente a la posición actual del cursor. Si se trata de otra palabra clave repetida, deberá utilizar las teclas numéricas para seleccionarla.
Por ejemplo: la palabra "Jia" y la palabra "xi" están descompuestas (FKUK) Debido a que la palabra "xi" se usa más comúnmente, ocupa el primer lugar y la palabra "Jia" ocupa el primer lugar. segundo. Si necesita la palabra "Jia", use la tecla numérica 2 para seleccionarla.
En los caracteres chinos, el orden de escritura de algunos caracteres a menudo difiere de persona a persona. Para adaptarse a esta situación, se permiten múltiples códigos de entrada para un carácter. Estos caracteres se denominan caracteres tolerantes a errores. En el esquema de entrada de codificación de fuentes Wubi, hay más de 500 caracteres tolerantes a errores.