¿Cuántos bits equivalen a un byte?
La correspondencia común entre caracteres codificados y bytes es la siguiente:
1. Código ASCII, una letra inglesa (independientemente del caso) ocupa un byte de espacio, un carácter chino ocupa dos bytes de espacio. Una secuencia de números binarios, como unidad digital en las computadoras, generalmente un número binario de 8 bits, convertido a decimal. El valor mínimo es 0 y el valor máximo es 255.
2. En la codificación UTF 8, un carácter inglés equivale a un byte y un carácter chino (incluido el chino tradicional) equivale a tres bytes.
3. En la codificación Unicode, una palabra en inglés equivale a dos bytes y un carácter chino (incluido el chino tradicional) equivale a dos bytes.
Símbolos: la puntuación en inglés ocupa un byte, la puntuación en chino ocupa dos bytes. Por ejemplo, el punto inglés "." ocupa 1 byte y el punto chino "." tiene un tamaño de 2 bytes.
4. El método de codificación de GBK es que el chino ocupa dos bytes y el inglés 1 byte.
Datos extendidos:
UTF 8 es un método de codificación muy común. Debido a que la conversión de bytes y caracteres UTF-8 no es fija, no se puede juzgar la cantidad de bytes de texto UTF-8 a partir de la cantidad de caracteres UNICODE.
UTF-8 es una codificación de longitud variable que requiere 2 bytes para codificar caracteres que requieren solo 1 byte en el conjunto de caracteres ASCII extendido.
ISO Latin-1 es un subconjunto de UNICODE, pero no un subconjunto de UTF-8. La codificación UTF-8 de 8 caracteres será filtrada por las puertas de enlace de correo electrónico porque los mensajes de Internet se diseñaron originalmente como ASCII de 7 bits. Entonces se produjo la codificación UTF-7. ?
UTF-8 utiliza el valor 100xxxxx en la representación con una probabilidad superior a 50, y las implementaciones existentes como los sistemas ISO 2022, 4873, 6429 y 8859 lo confundirán con el código de control C1. Por lo tanto, surgió la codificación UTF-7.5.
Enciclopedia Baidu-Caracteres
Enciclopedia Baidu-Bytes
Enciclopedia Baidu-Codificación