La Red de Conocimientos Pedagógicos - Conocimientos universitarios - 10.2 Por qué la tecnología de diseño de tuberías puede mejorar la frecuencia operativa de los sistemas digitales

10.2 Por qué la tecnología de diseño de tuberías puede mejorar la frecuencia operativa de los sistemas digitales

Tubería de CPU 1. Frecuencia principal La frecuencia principal también se llama frecuencia de reloj, y la unidad es MHz, que se utiliza para indicar la velocidad de computación de la CPU. Frecuencia principal de la CPU = FSB × factor de multiplicación. Mucha gente piensa que la frecuencia principal determina la velocidad de funcionamiento de la CPU. Esto no es sólo unilateral, sino que también para los servidores esta comprensión es parcial. Hasta el momento, no existe una fórmula definitiva que pueda determinar la relación numérica entre la frecuencia principal y la velocidad de cálculo real. Incluso los dos principales fabricantes de procesadores, Intel y AMD, tienen una gran controversia sobre este punto. Comenzamos con Intel mirando las tendencias de desarrollo de. En sus productos, se puede ver que Intel concede gran importancia a fortalecer el desarrollo de su propia frecuencia principal. Al igual que otros fabricantes de procesadores, alguien lo comparó alguna vez con un procesador Transmeta 1G. Su eficiencia operativa es equivalente a la de un procesador Intel 2G. Por lo tanto, la frecuencia principal de la CPU no está directamente relacionada con la potencia informática real de la CPU. La frecuencia principal indica la velocidad de oscilación de la señal de pulso digital en la CPU. También podemos ver ejemplos de esto en los productos de procesador de Intel: los chips Itanium de 1 GHz pueden funcionar casi tan rápido como los Xeon/Opteron de 2,66 GHz, o los Itanium 2 de 1,5 GHz son tan rápidos como los Xeon/Opteron de 4 GHz. La velocidad de cálculo de la CPU también depende de los indicadores de rendimiento de varios aspectos del proceso de la CPU. Por supuesto, la frecuencia principal está relacionada con la velocidad de cálculo real. Solo se puede decir que la frecuencia principal es solo un aspecto del rendimiento de la CPU y no representa el rendimiento general de la CPU. 3. Frecuencia del bus frontal (FSB) La frecuencia del bus frontal (FSB) (es decir, la frecuencia del bus) afecta directamente la velocidad del intercambio directo de datos entre la CPU y la memoria. Existe una fórmula que se puede calcular, es decir, ancho de banda de datos = (frecuencia del bus × ancho de banda de datos)/8. El ancho de banda máximo de transmisión de datos depende del ancho y la frecuencia de transmisión de todos los datos transmitidos simultáneamente. Por ejemplo, el Xeon Nocona actual que admite 64 bits tiene un bus frontal de 800 MHz. Según la fórmula, su ancho de banda máximo de transmisión de datos es de 6,4 GB/segundo. 6. Caché El tamaño de la caché también es uno de los indicadores importantes de la CPU, y la estructura y el tamaño de la caché tienen un gran impacto en la velocidad de la CPU. La caché de la CPU se ejecuta a una frecuencia extremadamente alta y generalmente funciona a la misma. frecuencia como el procesador, y la eficiencia del trabajo es mucho mayor que la memoria del sistema y el disco duro. En el trabajo real, la CPU a menudo necesita leer el mismo bloque de datos repetidamente, y el aumento en la capacidad de la caché puede mejorar en gran medida la tasa de aciertos de lectura de datos dentro de la CPU sin tener que buscarlos en la memoria o el disco duro, mejorando así el sistema. actuación. . Sin embargo, debido a factores como el costo y el área del chip de la CPU, el caché es muy pequeño. 11. Superpipeline y superescalar Antes de explicar superpipeline y superescalar, primero comprendamos el pipeline. Intel utilizó por primera vez el pipeline en el chip 486. La línea de montaje funciona como una línea de montaje en la producción industrial. En la CPU, una tubería de procesamiento de instrucciones se compone de 5 a 6 unidades de circuito con diferentes funciones, y luego una instrucción X86 se divide en 5 a 6 pasos y luego se ejecuta mediante estas unidades de circuito respectivamente, de modo que una instrucción se pueda completar en una. Ciclo de reloj de la CPU, aumentando así la velocidad de cálculo de la CPU. Cada canalización de números enteros del Pentium clásico se divide en cuatro niveles de canalización, a saber, captación previa de instrucciones, decodificación, ejecución y reescritura de resultados. El canalización de punto flotante se divide en ocho niveles de canalización. Superscalar utiliza múltiples canales integrados para ejecutar múltiples procesadores al mismo tiempo. Su esencia es intercambiar espacio por tiempo. El súper oleoducto consiste en completar una o más operaciones en un ciclo de máquina refinando el oleoducto y aumentando la frecuencia principal. Su esencia es intercambiar tiempo por espacio. Por ejemplo, la tubería del Pentium 4 tiene hasta 20 etapas. Cuanto más largos estén diseñados los pasos (etapas) de la canalización, más rápido podrá completar una instrucción, por lo que podrá adaptarse a CPU con frecuencias operativas más altas.

Sin embargo, un proceso demasiado largo también conlleva ciertos efectos secundarios. Es muy probable que la velocidad de cálculo real de una CPU con una frecuencia más alta sea menor. Este es el caso del Pentium 4 de Intel, aunque su frecuencia principal puede llegar a ser tan alta. 1,4G o más, pero su rendimiento informático es muy inferior al 1,2G Athlon de AMD o incluso al Pentium III. 12. El embalaje del CPU es una medida de protección que utiliza materiales específicos para solidificar el chip de la CPU o el módulo de la CPU para evitar daños. Generalmente, la CPU debe empaquetarse antes de poder entregarse al usuario. El método de empaquetado de la CPU depende de la forma de instalación de la CPU y del diseño de integración del dispositivo. Desde un punto de vista de clasificación amplio, las CPU que generalmente se instalan usando sockets Socket se empaquetan usando PGA (matriz de cuadrícula), mientras que las CPU instaladas usando ranuras Slot x se empaquetan todas. utilizando el formato de embalaje SEC (caja de conexiones de un solo lado). También existen tecnologías de embalaje como PLGA (Plastic Land Grid Array) y OLGA (Organic Land Grid Array). Debido a la competencia en el mercado cada vez más feroz, la dirección de desarrollo actual de la tecnología de empaquetado de CPU es principalmente el ahorro de costos.

Bien, algunos de los parámetros publicados anteriormente están directamente relacionados con la eficiencia operativa de la CPU. Algunos de los parámetros restantes son demasiado simples y algunos con los que no entramos en contacto con frecuencia no están publicados. Mire el origen de la tubería. Todos sabemos que dos CPU son más rápidas que una CPU, pero ¿por qué no sucede que una CPU ejecuta WORD y la otra CPU ejecuta CS? Hilos, se pueden ejecutar por separado, el MII de Cyrix, ¿no tenía una tecnología en ese momento, operación fuera de servicio? Era un medio para mejorar la eficiencia operativa, y la tubería también tenía este propósito en ese momento. En P4, había una canalización de 20 niveles, es decir, la CPU se ejecutó una vez al mismo tiempo, lo que equivale a 20 CPU (sin canalizaciones) ejecutándose al mismo tiempo. ¿Cuál es esta velocidad de ejecución original? aumentó 20 veces. Sin embargo, en realidad este no es el caso. ¿Por qué? Después de ejecutar estas 20 cosas, hay una cosa más que no se puede escribir. encendido, piensan que hay un problema con las materias primas), pensará que el resultado de esta operación es incorrecto y dirá: "Vuelva a instalarlo". Entonces, hay una CPU con solo 10-. etapa de la tubería, pero debido a que están bien administrados y no retrabajan cada vez que se ejecutan, su eficiencia de producción es en realidad mayor que AMD e INTEL. En este caso, si uno se concentra en la administración y la administración mejora, ¡los trabajadores de abajo! cometeremos menos errores (menos retrabajos), por otro lado, si los trabajadores se vuelven competentes, la calidad de los productos producidos será alta (cada vez saldrán más cosas) ¡¡Por supuesto, tenemos que centrarnos tanto en la gestión como en la gestión!! Necesitamos centrarnos en ambas, y ambas deben ser fuertes. Esta es la idea china. Las personas que se centran en ambas obviamente no hicieron nada bien y todas quebraron. Ahora... Ahora quiero darle una visión clara de la línea de ensamblaje. Si el nivel de ensamblaje de su CPU es muy pobre, entonces, por supuesto, cuantas más líneas de ensamblaje haya, más caótico será, al igual que su nivel. No es bueno, la gestión, con más de 10.000 programadores maestros, el proyecto es un desastre. Sin embargo, si usted es una persona con una gran experiencia en gestión y las personas de abajo no saben cómo hacer el trabajo, entonces el proyecto también es un fracaso. Afortunadamente, de hecho, no es absolutamente así. Los administradores están aproximadamente al mismo nivel y los programadores también están al mismo nivel. Entonces, cuando crees un proyecto, ¡el programador que elijas será un buen administrador! !!Dije, no necesariamente, tengo que mirar cuál es el proyecto. Si el proyecto es un proyecto común y corriente, un administrador común puede ser suficiente. Entonces, por supuesto, elegí un buen programador y el proyecto se completó rápidamente. Bueno, un programa en sí puede funcionar fuera de orden, así que, por supuesto, la CPU de INTEL es la mejor. De todos modos, ¡nadie lo reelaborará! ¡Pero un proyecto es muy complejo y la cantidad de código no es mucha! Por supuesto, se debe seleccionar un buen administrador. Si se prueba un programa, lo que lleva a reelaboraciones constantes de las operaciones de la CPU, por supuesto, la CPU de AMD es mejor. Por ejemplo, en la operación de grandes números de punto flotante, AMD es 50 veces mejor. que INTEL. Ahora no puedes ver esta comparación. Sin embargo, puedes verificarla. Según los datos, existe una comparación entre PIII1G y AMD Athlon 1G. Esta diferencia no ha cambiado hasta ahora. Los puntajes de la CPU y la tarjeta gráfica de AMD son más altos que los de INTEL. Los puntajes de 3Dmark2001 son generalmente más altos que los de INTEL. Y, piedra de negocios, INTEL es generalmente más alto que AMD, SYSMARK, además, INTEL es más alto que AMD, porque estos programas. no son complicados (la complejidad del hilo es diferente de lo que pensamos que el programa en sí es complicado) Lo mismo ocurre con la compra de una CPU, AMD y ¿Qué INTEL es mejor? No lo sé. Me gusta AMD, pero uso INTEL. Por el momento, las dos máquinas en casa son INTEL. Sin AMD, INTEL no sería tan barato. Sin AMD, el software de la versión D de China... Sin embargo, Quiero rectificar el nombre de la línea de montaje. No significa que cuanto más larga sea la línea de montaje, menor será la eficiencia operativa.

Cuanto más larga sea la línea de montaje, mayor será definitivamente la eficiencia operativa. Sin embargo, el costo de los errores operativos será mayor. La línea de montaje en sí es una tecnología que mejora la eficiencia. ¿Por qué la gente hoy en día la considera un medio que debe ser? ¿Se usaba para aumentar la frecuencia? ¿Qué? Cuando no había una línea de ensamblaje en ese momento, cuando apareció la línea de ensamblaje, ¡todos pensaron que era un arma secreta para mejorar la eficiencia! línea de montaje, por lo que el rendimiento de P4 es peor. Es una prueba puramente teórica, como Sandra, pcmark y 3dmark, P4 funciona bien (para ser honesto, el rendimiento de P4 en 3dmark es mejor que el de bussiness winstone cuando se trata de pruebas reales, especialmente bussiness winstone (llamada directa). código fuente de Office) o sciencemark (código de química cuántica estándar compilado directamente), el rendimiento de p4 no es nada. . . . Incluso P4c no es rival para AthlonXP con el mismo PR. En cuanto a la alta puntuación de Intel en sysmark, ese es un error famoso, porque sysmark cree que AthlonXP no es compatible con SSE. El resultado es que AthlonXP usa punto flotante x87 para combatir códigos multimedia especialmente optimizados para SSE, y el rendimiento es naturalmente pobre. (Aún así Intel no tiene mucha ventaja) ) En los resultados de las pruebas de Business Winstone 2002, encontrará que el rendimiento del P4 3.2c puede igualar al AthlonXp 3200, que es reconocido como el estándar falso más serio. Por supuesto, en términos de rendimiento multimedia, el P4 3.2c sigue sin duda superando al AXP 3200. Después de todo, AXP no es compatible con SSE2. Incluso sin reelaboración de la canalización, el rendimiento de una canalización larga es el mismo que el de una canalización corta, porque cada canalización solo puede ejecutar una instrucción por ciclo (p4 tiene un diseño extraño que si ejecuta dos microinstrucciones simples emparejadas, entonces dos pueden combinarse en una ejecución, por lo que si ejecuta repetidamente la misma instrucción, como a = a 1 10 mil millones de veces, entonces P4 es dos veces más rápido que AthlonXP), por lo que es imposible mejorar la eficiencia en cualquier ángulo con tuberías largas. La única ventaja de una tubería larga es que el circuito es relativamente simple y más fácil de diseñar. Para explicarlo en detalle, eso no significa que la tubería de 20 etapas realice el doble de acciones que la tubería de 10 etapas. las funciones reales que pueden realizar son las mismas, excepto que las operaciones realizadas en cada nivel son más simples. Por ejemplo, una fábrica que fabrica tornillos se puede dividir en dos etapas, una para tornillos artificiales y otra para roscado. También se puede dividir en 100 pasos. La primera persona se encarga de sostener el bloque de hierro, la segunda persona se encarga de pasarlo y la tercera persona se encarga de trazar la línea hacia arriba. . . . La persona número 99 recorre el hilo impar y la persona número 100 es responsable de limpiar el polvo. Si cada paso toma el mismo tiempo, entonces la velocidad de los dos métodos es exactamente la misma. La única diferencia es que la calidad de los trabajadores en el método anterior debe ser muy alta, porque cada uno de ellos hace el trabajo de 50 personas. la otra parte.