Papel de rastreo web basado en C#~~~¡Arrodíllate!
3.1 Análisis de requisitos
Este sistema es un subproyecto del proyecto de búsqueda distribuida en varios idiomas. Este proyecto de búsqueda distribuida en varios idiomas incluye principalmente dos partes: una es la parte de recopilación de datos y la segunda parte es la búsqueda de información. El artículo es el principal responsable de obtener información de datos. Antes de explicar el contenido de este capítulo en detalle, presente los antecedentes del proyecto. En pocas palabras, este proyecto consiste en ingresar una palabra clave en un idioma determinado y luego encontrar información relacionada con esta palabra clave en varios idiomas. El avance actual de este proyecto es que se puede buscar información en 27 idiomas. Estos incluyen idiomas convencionales como el chino, japonés, inglés, alemán, francés y ruso, así como idiomas de menor escala como el mongol, el vietnamita y el hindi. Al mismo tiempo, el proyecto de búsqueda distribuida en varios idiomas busca principalmente información de noticias relacionada con estos 27 idiomas. Finalmente, este proyecto de búsqueda distribuida en varios idiomas estipula claramente que tanto los sistemas de rastreo web como los sistemas de búsqueda de información deben utilizar estructuras distribuidas.
3.1.1 Análisis de requisitos funcionales
Debido a que este sistema es el subárbol del proyecto de búsqueda distribuida en varios idiomas, antes de presentarlo, primero tenemos una descripción general del diseño general. del proyecto de búsqueda en varios idiomas. Una comprensión aproximada. A través de la explicación de este resumen, puede comprender el sistema de rastreo web distribuido en su conjunto, comprender el diseño general del módulo del sistema y comprender la importancia del sistema en todo el proyecto, para realizar mejor el análisis de la demanda. Al mismo tiempo, también puede comprender el propósito y el trabajo del sistema de rastreo y sentar las bases para el trabajo de indexación posterior.
El marco utilizado por el proyecto de búsqueda distribuida en varios idiomas es el marco del sistema distribuido Hadoop, ampliamente utilizado. Según la introducción del capítulo anterior, sabemos que Hadoop es en realidad un marco basado en computación en la nube, compuesto principalmente por modelos HDFS y Map/Reduce. Los usuarios no necesitan comprender el proceso de implementación subyacente cuando utilizan este marco, lo que hace que sea más conveniente desarrollar programas. Este proyecto de búsqueda distribuida en varios idiomas tiene aproximadamente cinco módulos funcionales, cada uno de los cuales tiene su correspondiente modelo informático Map/Reduce. Este módulo incluye cinco módulos: sistema de rastreo, análisis, indexación, búsqueda y consulta. En particular, estos cinco módulos deben utilizar tecnología distribuida. Este artículo analiza cómo utilizar tecnología distribuida para implementar un sistema de rastreo web. La Figura 3-1 muestra el diagrama de división de módulos funcionales del proyecto.
Más bien, puedes confiar en mí en privado...