El proceso de desarrollo de los fabricantes de unidades centrales de procesamiento (CPU)
Sin embargo, a partir de la década de 1970, debido al uso a gran escala de circuitos integrados, la CPU, que originalmente requería varias unidades independientes, se integró en un pequeño pero potente microprocesador. De hecho, este nombre y su abreviatura se utilizan ampliamente en la industria de la informática electrónica. Aunque las CPU han evolucionado enormemente en términos de forma física, diseño y fabricación, y desempeño de tareas específicas en comparación con sus inicios, sus principios básicos de funcionamiento no han cambiado.
En 1971, Intel, que en ese momento aún se encontraba en la etapa de desarrollo, lanzó el primer microprocesador verdadero del mundo, el 4004. Este no solo fue el primer microprocesador de 4 bits utilizado en calculadoras, sino que también fue el primer procesador de computadora asequible.
El 4004 contenía 2.300 transistores, tenía una funcionalidad muy limitada y era muy lento. Fue despreciado por el entonces gigante azul IBM y por la mayoría de los usuarios empresariales, pero después de todo, fue un producto que hizo época. Desde entonces, Intel ha sido inseparable de los microprocesadores. Se puede decir que el desarrollo histórico de la CPU es en realidad el desarrollo de la CPU de la serie Intel X86, que es el "viaje de la historia de la CPU". En 1978, Intel una vez más lideró la tendencia y produjo el primer microprocesador de 16 bits, denominado i8086. Al mismo tiempo, también se lanzó un coprocesador matemático i8087. Los dos chips utilizan conjuntos de instrucciones compatibles, pero el conjunto de instrucciones i8087 agrega algunas instrucciones específicas para cálculos matemáticos como logaritmos, funciones exponenciales y trigonométricas. Debido a que estos conjuntos de instrucciones se aplican a i8086 e i8087, la gente también las llama colectivamente conjunto de instrucciones X86.
Aunque Intel produjo la segunda y tercera generación de CPU nuevas, más avanzadas y más rápidas, todavía eran compatibles con las instrucciones X86 originales, e Intel siguió la secuencia X86 original al nombrar las CPU posteriores hasta más tarde, debido a la marca registrada. Problemas de registro, se abandonó el uso de números arábigos para nombrar la CPU. En cuanto a otras empresas que se desarrollaron más tarde, como AMD y Cyrix, las CPU anteriores a 486 (incluida la 486) recibieron el nombre de sus propias CPU X86. Sin embargo, en la época de 586, la competencia en el mercado se volvió cada vez más feroz. Debido a problemas de registro de marcas, ya no pueden usar nombres iguales o similares a los de las CPU X86 de Intel, por lo que deben nombrar sus propias CPU compatibles con 586 y 686.
En 1979, Intel lanzó el chip 8088, que todavía era un microprocesador de 16 bits y contenía 29.000 transistores. La frecuencia del reloj es de 4,77 MHz, el bus de direcciones es de 20 bits y se puede utilizar 1 MB de memoria. El bus de datos interno del 8088 es de 16 bits y el bus de datos externo es de 8 bits, mientras que su hermano 8086 es de 16 bits. En 1981, el chip 8088 se utilizó por primera vez en la PC (computadora personal) de IBM, marcando el comienzo de una nueva era de microcomputadoras. También fue a partir del 8088 que el concepto de PC comenzó a desarrollarse a escala global.
Las primeras CPU generalmente se personalizaban para computadoras grandes y especializadas. Sin embargo, este costoso enfoque de personalizar las CPU para aplicaciones específicas ha dado paso en gran medida al desarrollo de clases de procesadores estandarizados y baratos adecuados para uno o más propósitos.
Esta tendencia hacia la estandarización comenzó en la era de las mainframes y microcomputadoras compuestas por transistores individuales y se aceleró con la llegada de los circuitos integrados. Los circuitos integrados permiten diseñar y fabricar CPU más complejas en espacios muy pequeños (del orden de micras).
En 1982, cuando muchos lectores jóvenes aún estaban en su infancia, Intel lanzó su último producto histórico, el chip Zao 80286, que supuso un gran desarrollo en comparación con el 8086 y el 8088. Aunque en aquel momento todavía era una estructura de 16 bits, había 134.000 transistores en la CPU. Sus buses de datos internos y externos son de 16 bits, el bus de direcciones es de 24 bits y puede direccionar 16 MB de memoria. A partir de 80286, la CPU evolucionó a dos modos de trabajo: modo real y modo protegido.
En 1985, Intel lanzó el chip 80386, que fue el primer microprocesador de 32 bits de la serie 80X86. Su proceso de fabricación también ha experimentado grandes avances.
En comparación con 80286, 80386 contiene 275.000 transistores y tiene una frecuencia de reloj de 12,5 MHz, que luego se incrementó a 20 MHz, 25 MHz y 33 MHz. Los buses de datos internos y externos del 80386 son ambos de 32 bits, y el bus de direcciones también es de 32 bits y puede direccionar hasta 4 GB de memoria. Además del modo real y el modo protegido, también agrega un modo de trabajo llamado virtual 86, que puede proporcionar capacidades multitarea simulando múltiples procesadores 8086 al mismo tiempo.
Además del chip estándar 80386, al que a menudo se hace referencia como 80386DX, debido a diferentes consideraciones de mercado y aplicaciones, Intel también ha lanzado otros tipos de chips 80386: 80386SX, 80386SL, 80386DL, etc.
En 1988, Intel lanzó el 80386SX, un chip posicionado entre 80286 y 80386DX en el mercado. La diferencia con 80386DX es que el bus de datos externo y el bus de direcciones son los mismos que 80286, que son 16 bits y 24 bits respectivamente (es decir, la capacidad de direccionamiento es 16 MB). En la década de 1990, Intel introdujo el 80386 SL y el 80386 DL, que son chips de bajo consumo que ahorran energía y se utilizan principalmente en computadoras portátiles y de escritorio que ahorran energía. La diferencia entre 80386 SL y 80386 DL es que el primero se basa en 80386SX y el segundo en 80386DX, pero ambos añaden un nuevo modo de trabajo: el modo de gestión del sistema. Al ingresar al modo de administración del sistema, la CPU reducirá automáticamente la velocidad de ejecución, controlará la pantalla, el disco duro y otros componentes para que dejen de funcionar, o incluso dejará de funcionar y entrará en el estado de "suspensión" para lograr el propósito de ahorrar energía.
En 1989, Intel lanzó el conocido chip 80486. Lo mejor de este chip es que realmente rompe la barrera de los 10.000 transistores e integra 12.000 transistores. La frecuencia de reloj del 80486 aumentó gradualmente de 25MHz a 33MHz y 50MHz. 80486 integra 80386, el coprocesador matemático 80387 y un caché de 8 KB en un chip. La serie 80X86 utiliza por primera vez la tecnología RISC (conjunto de instrucciones reducido) y se puede ejecutar una instrucción en un ciclo de reloj. También utiliza un modo de bus en ráfaga, que mejora enormemente la velocidad del intercambio de datos con la memoria.
Debido a estas mejoras, el 80486 funciona 4 veces mejor que el 80386DX con el coprocesador matemático 80387. Al igual que 80386, existen varios tipos de 80486. El modelo original presentado anteriormente es 80486DX.
En 1990, Intel lanzó el 80486 SX, un modelo de bajo coste del tipo 486. La diferencia con el 80486DX es que no tiene coprocesador matemático. 80486 DX2 utiliza tecnología de multiplicación de reloj, lo que significa que el chip interno funciona dos veces más rápido que el bus externo, es decir, el chip interno funciona al doble de la velocidad del reloj del sistema, pero aún se comunica con el mundo exterior a la velocidad del reloj original. . Las frecuencias de reloj interno del 80486 DX2 incluyen principalmente 40MHz, 50MHz y 66MHz. El 80486 DX4 también es un chip que utiliza tecnología de multiplicación de reloj, lo que permite que sus unidades internas funcionen a dos o tres veces la velocidad del bus externo. Para admitir esta mayor frecuencia operativa interna, su caché en el chip se amplía a 16 KB. El 80486 DX4 tiene una frecuencia de reloj de 100MHz, que es un 40% más rápido que los 66MHz del 80486 DX2. 80486 también tiene una versión mejorada SL con modo de administración del sistema para computadoras portátiles o computadoras de escritorio que ahorran energía.
La estandarización y miniaturización de las CPU ha hecho que este tipo de equipos digitales (traducidos como "piezas electrónicas" en Hong Kong) aparezcan con más frecuencia en la vida moderna que los ordenadores con aplicaciones limitadas. Los microprocesadores modernos se encuentran en todo, desde automóviles hasta teléfonos móviles y juguetes para niños. La frecuencia principal también se denomina frecuencia de reloj y la unidad es megahercios (MHz) o gigahercios (GHz), que se utiliza para indicar la velocidad de funcionamiento de la CPU y el procesamiento de datos.
Frecuencia principal de la CPU = frecuencia externa × factor de multiplicación. Mucha gente cree que la frecuencia principal determina la velocidad de funcionamiento de la CPU. Esto no sólo es unilateral, sino que también está sesgado para los servidores. Hasta el momento, no existe una fórmula definitiva que pueda determinar la relación numérica entre la frecuencia principal y la velocidad de funcionamiento real. Incluso los dos principales fabricantes de procesadores, Intel y AMD, tienen grandes disputas sobre este punto.
De la tendencia de desarrollo de los productos Intel se puede ver que Intel concede gran importancia al fortalecimiento del desarrollo de su propia frecuencia principal. Al igual que otros fabricantes de procesadores, alguien comparó una vez un procesador Transmeta de 1 GHz con una eficiencia operativa equivalente a un procesador Intel de 2 GHz.
Existe una cierta relación entre la frecuencia principal y la velocidad de carrera real, pero no es una simple relación lineal. Por lo tanto, la frecuencia principal de la CPU no tiene relación directa con la potencia informática real de la CPU. La frecuencia principal representa la velocidad de oscilación de la señal de pulso digital en la CPU. También podemos ver este ejemplo en los productos de procesador de Intel: un chip Itanium de 1 GHz es casi tan rápido como un Xeon/Snapdragon de 2,66 GHz, o un Itanium 2 de 1,5 GHz es tan rápido como un Xeon/Snapdragon de 4 GHz. La velocidad de ejecución de la CPU depende de los indicadores de rendimiento de la canalización de la CPU, el bus, etc.
La frecuencia principal está relacionada con la velocidad real de carrera. Solo se puede decir que la frecuencia principal es solo un aspecto del rendimiento de la CPU y no representa el rendimiento general de la CPU. La frecuencia externa es la frecuencia de referencia de la CPU y la unidad es MHz. La frecuencia externa de la CPU determina la velocidad de funcionamiento de toda la placa base. En términos generales, en las computadoras de escritorio, el overclocking es el FSB de la súper CPU (por supuesto, en general, es el multiplicador bloqueado de la CPU). Creo que esto se entiende bien. Pero para las CPU de servidor, el overclocking no está permitido en absoluto. Como se mencionó anteriormente, la CPU determina la velocidad de funcionamiento de la placa base y las dos se ejecutan simultáneamente. Si se overclockea la CPU del servidor y se cambia la frecuencia externa, se producirá una operación asincrónica (muchas placas base de computadoras de escritorio admiten la operación asincrónica), lo que provocará inestabilidad en todo el sistema del servidor.
Actualmente, en la mayoría de los sistemas informáticos, la frecuencia externa y el bus frontal de la placa base no están sincronizados, y la frecuencia externa y la frecuencia del bus frontal (FSB) se confunden fácilmente. El siguiente bus frontal presenta la diferencia entre los dos. La frecuencia del bus frontal (FSB) afecta directamente la velocidad del intercambio directo de datos entre la CPU y la memoria. Existe una fórmula que se puede calcular, que es ancho de banda de datos = (frecuencia del bus × ancho de bits de datos) / 8. El ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Por ejemplo, Xeon Nocona, que actualmente admite 64 bits, tiene un bus frontal de 800 MHz. Según la fórmula, su ancho de banda máximo de transmisión de datos es 6,4 GB/s.
La diferencia entre la frecuencia FSB y la frecuencia FSB: la velocidad FSB se refiere a la velocidad de transmisión de datos y FSB se refiere a la operación sincrónica. de la CPU y la velocidad de la placa base. En otras palabras, la frecuencia externa de 100MHz significa que la señal de pulso digital oscila 100 millones de veces por segundo; el bus frontal de 100MHz significa que la capacidad de transmisión de datos aceptable de la CPU por segundo es 100 MHz × 64 bit÷8 bit/ bytes = 800 MB/s.
De hecho, la aparición de la arquitectura "HyperTransport" ha cambiado la frecuencia del FSB en un sentido práctico. La arquitectura IA-32 debe tener tres componentes importantes: el concentrador del controlador de memoria (MCH), el concentrador del controlador de E/S y el concentrador PCI, como los conjuntos de chips típicos de Intel Intel 7501 e Intel7505, que están diseñados para procesadores Xeon duales. . El MCH que contienen proporciona un bus frontal con una frecuencia de 533 MHz para la CPU. Con memoria DDR, el ancho de banda del bus frontal puede alcanzar los 4,3 GB/s. Sin embargo, a medida que el rendimiento del procesador continúa mejorando. Ha traído muchos problemas a la arquitectura del sistema. La arquitectura "HyperTransport" no solo resuelve el problema, sino que también mejora de manera más efectiva el ancho de banda del bus, como los procesadores AMD Opteron. La arquitectura flexible del bus HyperTransport I/O le permite integrar el controlador de memoria, permitiendo al procesador intercambiar datos directamente con la memoria sin transmitirlos a través del bus del sistema al chipset. En este caso, la frecuencia del bus frontal (FSB) en los procesadores AMD Opteron no tiene idea de por dónde empezar. Bit: en circuitos digitales y tecnología informática, se utiliza codificación binaria, y la codificación es solo "0" y "1", donde "0" y "1" son bits en la CPU.
Longitud de palabra: en tecnología informática, el número de dígitos binarios que la CPU puede procesar a la vez por unidad de tiempo (simultáneamente) se denomina longitud de palabra. Por lo tanto, una CPU que puede procesar datos con una longitud de palabra de 8 bits a menudo se denomina CPU de 8 bits. De manera similar, una CPU de 32 bits puede procesar datos binarios de 32 bits por unidad de tiempo.
La diferencia entre longitud de byte y palabra: dado que los caracteres ingleses de uso común se pueden representar mediante binario de 8 bits, los 8 bits generalmente se denominan byte. La longitud de la palabra no es fija y varía para diferentes CPU y longitudes de palabra. Una CPU de 8 bits sólo puede procesar un byte a la vez, mientras que una CPU de 32 bits puede procesar cuatro bytes a la vez. Asimismo, una CPU con una longitud de palabra de 64 bits puede manejar 8 bytes a la vez. El tamaño de la caché también es uno de los indicadores importantes de la CPU. La estructura y el tamaño de la caché tienen un gran impacto en la velocidad de la CPU. El caché de la CPU se ejecuta a una frecuencia muy alta, generalmente a la misma frecuencia que el procesador, y su eficiencia de trabajo es mucho mayor que la de la memoria del sistema y el disco duro. En el trabajo real, la CPU a menudo necesita leer el mismo bloque de datos repetidamente. El aumento en la capacidad de la caché puede mejorar en gran medida la tasa de aciertos de lectura de datos dentro de la CPU sin buscar en la memoria o el disco duro, mejorando así el rendimiento del sistema. Sin embargo, debido al costo y el área del chip de la CPU, el caché es pequeño.
La caché L1 es la caché de primer nivel de la CPU y se divide en caché de datos y caché de instrucciones. La capacidad y estructura de la caché L1 incorporada tienen un gran impacto en el rendimiento de la CPU. Sin embargo, las memorias caché están compuestas de RAM estática y tienen estructuras complejas. Cuando el área de la CPU no puede ser demasiado grande, la capacidad de la caché L1 no puede ser demasiado grande. La capacidad de caché L1 de una CPU de servidor general suele ser de 32 a 256 KB.
La caché L2 es la caché de segundo nivel de la CPU y se divide en chips internos y externos. La caché L2 interna en el chip se ejecuta a la misma velocidad que la frecuencia principal, mientras que la caché L2 externa es solo la mitad de la frecuencia principal. La capacidad de la caché L2 también afecta el rendimiento de la CPU. El principio es que cuanto mayor sea la CPU, mejor. En el pasado, la mayor capacidad de CPU doméstica era de 512 KB, que ahora puede alcanzar los 2 M en las computadoras portátiles, mientras que la caché L2 de la CPU utilizada por servidores y estaciones de trabajo es aún mayor, alcanzando más de 8 M.
La caché L3 (caché de tres niveles) se divide en dos tipos, la temprana externa y la actual interna. Su efecto real es que la aplicación de caché L3 puede reducir aún más la latencia de la memoria y mejorar el rendimiento del procesador al calcular grandes cantidades de datos. Reduzca la latencia de la memoria y mejore la potencia informática de big data, lo cual es muy útil para los juegos. Sin embargo, todavía hay una mejora significativa en el rendimiento al agregar caché L3 en el mundo de los servidores. Por ejemplo, una configuración con una caché L3 más grande puede usar la memoria física de manera más eficiente, por lo que puede manejar más solicitudes de datos que un subsistema de E/S de disco más lento. Los procesadores con cachés L3 más grandes proporcionan un comportamiento de caché del sistema de archivos más eficiente y longitudes de cola de mensajes y procesadores más cortas.
De hecho, la primera aplicación de caché L3 estaba en el procesador K6-III lanzado por AMD. En ese momento, la caché L3 no estaba integrada en el chip, sino en la placa base por motivos del proceso de fabricación. La caché L3 solo se puede sincronizar con la frecuencia del bus del sistema y no es muy diferente de la memoria principal. Posteriormente, Intel introdujo la caché L3 para el procesador Itanium para el mercado de servidores. Luego están el P4EE y el Xeon MP. Intel también planea lanzar en el futuro un procesador Itanium2 de caché L3 de 9 MB y un procesador Itanium2 de doble núcleo de caché L3 de 24 MB.
Pero la caché L3 no es muy importante para mejorar el rendimiento del procesador. Por ejemplo, el procesador Xeon MP equipado con 1 MB de caché L3 todavía no es rival para Snapdragon. Esto muestra que el aumento del bus frontal traerá mejoras de rendimiento más efectivas que el aumento del caché. A partir de la 586CPU, el voltaje de funcionamiento de la CPU se divide en voltaje del núcleo y voltaje de E/S. Normalmente, el voltaje del núcleo de la CPU es menor o igual que el voltaje de E/S. Entre ellos, el tamaño del voltaje del núcleo depende del proceso de producción de la CPU. Generalmente, cuanto más pequeño es el proceso de producción, menor es el voltaje de funcionamiento del núcleo. El voltaje de E/S es generalmente de 1,6 ~ 5 V. El bajo voltaje puede resolver los problemas de consumo excesivo de energía y generación excesiva de calor.