Investigación sobre el algoritmo del sitio web de noticias Java
1. Definición de connotación de algoritmo. Los algoritmos se originan en las matemáticas, pero los algoritmos modernos van mucho más allá del alcance de cálculo de las matemáticas tradicionales. Los algoritmos generalmente se entienden como programas o pasos que utilizan las computadoras para resolver problemas y son la columna vertebral operativa de los sistemas modernos de inteligencia artificial. Computacionalismo: una nueva visión del mundo (Li Jianhui et al., 2012) define los algoritmos como métodos factibles. En el sentido común del mundo exterior, el llamado algoritmo es un conjunto de reglas de cálculo que se pueden sentir. Las características de esta regla son tiempo de operación limitado, pasos de cálculo limitados y resultados de entrada precisos. Es un paso mecánico o un procedimiento computable. Esta definición señala dos propiedades básicas que deben tener los algoritmos: finitud y finitud. Ver el mundo desde una perspectiva computacional (Li, 2016) interpreta los algoritmos desde la perspectiva de la difusión de información y cree que los algoritmos son esencialmente un método de procesamiento de información.
2. Investigación sobre ética de algoritmos
La ética está relacionada con los valores morales, la verdad y el juicio. Las personas que existen en la naturaleza y la sociedad deben seguir ciertas normas éticas en su comportamiento. El papel de la ética debe estar dirigido al bien. La ética se centra en el respeto a la existencia individual, la libertad individual, la equidad y la justicia, y la continuación y el desarrollo de organizaciones y grupos. Hasta cierto punto, la sociedad humana actual ya no puede funcionar sin sistemas de algoritmos inteligentes.
Los algoritmos afectan al mundo todo el tiempo, por lo que inevitablemente tocarán la ética. Él (2017) señaló una vez que la aplicación generalizada de sistemas algorítmicos en la vida social humana caerá en muchos dilemas éticos que los humanos enfrentan y no pueden evitar. Pero cuando los algoritmos se vinculan con la ética, generalmente se cree que surgirán dos cuestiones éticas: la ética profesional y la ética tecnológica.
La ética profesional está relacionada principalmente con los desarrolladores de sistemas algorítmicos, es decir, los desarrolladores son los actores que desarrollan sistemas algorítmicos y tienen valores de personalidad y ética, por lo que los sistemas algorítmicos se mezclarán con los diseñadores. El principio de la moral subjetiva. El propósito del diseñador de desarrollar un sistema algorítmico y la actitud ética del diseñador hacia diferentes cuestiones se reflejarán en el funcionamiento del sistema algorítmico.
La ética técnica es un sistema algorítmico, que puede denominarse ciencia y tecnología en cierto sentido. Esta tecnología en sí y los resultados de su operación estarán cargados de valores éticos. De hecho, en algunos casos, no existe una distinción clara entre ética profesional y ética técnica. Liu Zeyuan y Wang Guoyu han discutido este punto.
Este artículo intenta realizar una investigación en profundidad sobre las cuestiones éticas de los algoritmos desde la perspectiva de la ética técnica.
(2) Investigación sobre la ética algorítmica de la comunicación de noticias en línea
La integración de algoritmos y tecnología continúa utilizándose en el campo de la comunicación de noticias en línea, desde el periodismo de datos hasta la escritura automática. desde el impulso de algoritmos hasta el análisis de la opinión pública, las noticias automáticas y la investigación relacionada en el campo de los medios de noticias nacionales también se están desarrollando gradualmente. En "Machine News Writing: An Ongoing Revolution" (2014), el autor se centró anteriormente en la producción y edición de contenido de noticias basado en algoritmos. Se cree que con el rápido desarrollo de la producción automatizada de noticias, el trabajo básico que requiere mucha mano de obra y la producción o distribución de noticias serán reemplazados por la tecnología. En "De los bits a la inteligencia artificial: el cambio algorítmico en la producción de noticias digitales" (2017), Juck Zhang y Zhong Xin creen que los algoritmos están pasando de la forma de bits a la etapa de inteligencia artificial, aclarando los límites entre las noticias digitales y las noticias tradicionales. , e impulsar la Transformación digital de la producción informativa. En "Riesgos éticos y estrategias de prevención de las recomendaciones de algoritmos inteligentes", Hu resumió el impacto negativo en los valores de las noticias desde el aspecto del impulso de los algoritmos, así como el debilitamiento de la publicidad, la objetividad y la autenticidad de las noticias por parte de la audiencia; se discutirá en detalle el fenómeno del capullo de información y se discutirá el derecho de la audiencia a saber y el derecho a ser olvidado desde la perspectiva del impacto social, el impacto negativo en los grupos sociales, los campos sociales y la cultura social;
De acuerdo con la literatura anterior, se puede ver que la investigación nacional actual sobre la ética de los algoritmos de difusión de noticias en línea se centra principalmente en cuestiones relacionadas con la anomia ética en los algoritmos de formato de noticias, porque es más fácil de descubrir que otros problemas de anomia. Sin embargo, todavía existen algunas deficiencias en la investigación nacional actual sobre la ética de los algoritmos de difusión de noticias en línea: la investigación nacional sobre la ética de los algoritmos de difusión de noticias en línea y la ética de los algoritmos aún está en su infancia, y aún no ha aparecido una investigación sistemática relativamente madura; el mecanismo de responsabilidad de los desarrolladores de algoritmos y las plataformas La investigación es relativamente débil. En general, es necesario seguir fortaleciendo la investigación sobre cuestiones éticas en las noticias basadas en algoritmos.
2. El surgimiento, desarrollo y principios de los algoritmos de recomendación de noticias.
2.1 El auge de los algoritmos de recomendación de noticias
A medida que la dimensión de procesamiento de información de la tecnología informática se vuelve cada vez mayor, las capacidades de procesamiento de información también mejoran constantemente. La tecnología de algoritmos puede filtrar la información que más preocupa e interesa a los usuarios de big data, cambiando el modelo original de difusión de información de noticias y remodelando la nueva ecología de los medios y el patrón de comunicación.
Por otro lado, en el contexto donde todos pueden producir información, la velocidad de producción, difusión y retroalimentación de la información aumenta exponencialmente, y los usuarios se enfrentan a cada vez más información. Debido a las limitaciones de los dispositivos y a la enorme cantidad de información, los usuarios no pueden concentrarse en lo que les interesa y no pueden captar información útil de manera oportuna, por lo que aparece la "economía de la atención". El economista estadounidense Michael Goldheimer (1997) cree que la sociedad actual es una sociedad con información extremadamente rica e incluso inundada, y la aparición de Internet ha acelerado este proceso. La información no es un recurso escaso, sino un excedente. Frente al exceso de información, sólo un recurso escasea: la atención humana. En otras palabras, la información no puede perseguir ciegamente la cantidad, sino que también debe ser valiosa. El valor radica en la atención del usuario a la información. Quien llame la atención de los usuarios tendrá espacio para el desarrollo del mercado. Las nuevas plataformas de agregación de medios pueden generar ganancias y mantener el desarrollo "vendiendo" la atención de los usuarios. Además, el ritmo de vida es cada vez más rápido, las personas tienen cada vez mayores necesidades de información y eficiencia y no quieren perder el tiempo en información que no les interesa. Por eso, la función "personalizada" de los usuarios El acceso a la información se ha vuelto obvio.
A partir de estos antecedentes, el mecanismo de difusión de noticias basado en algoritmos surgió según lo requieren los tiempos. Los usuarios no necesitan buscar la información que necesitan, pero la información masiva "encontrará" al usuario por sí sola, ahorrándoles tiempo de búsqueda y brindándoles información realmente útil.
2.2 Estado de desarrollo actual de los algoritmos de recomendación de noticias
La recomendación de algoritmo consiste en recomendar información en campos específicos a los usuarios en función de los datos del usuario, y revisar y mejorar continuamente el plan de recomendación en función de la audiencia. comentario. Hay dos tipos principales de organizaciones de noticias que actualmente utilizan algoritmos push. El primer tipo es un nuevo tipo de plataforma de agregación de noticias de Internet. En China, está representado principalmente por plataformas algorítmicas como Toutiao y Yidian.com, que ocupan una cuota de mercado muy alta en el mercado de clientes de noticias chinos. Zhang Yiming creó Toutiao basándose en big data y algoritmos para recomendar información a los usuarios y brindar servicios que conecten a las personas y la información. El algoritmo determinará los intereses y pasatiempos del usuario a través de palabras clave y otros elementos, rastreará contenido de toda la red e implementará recomendaciones personalizadas. Los países extranjeros están representados por plataformas como Facebook e Instagram. Estas aplicaciones extraen los datos de los usuarios a través de algoritmos y envían noticias a los usuarios en función de sus necesidades personalizadas. La otra categoría son los medios tradicionales con producción de noticias profesional. Para responder activamente a la competencia en el mercado de noticias, mejorar la tecnología y transformarse en una plataforma de noticias para todos los medios, como el Diario del Pueblo de China. Los medios tradicionales que utilizan algoritmos para enviar noticias a usuarios extranjeros incluyen Associated Press y el Washington Post en Estados Unidos y la BBC en el Reino Unido. Utilizan algoritmos para monitorear la cantidad de audiencias y su comportamiento de lectura, haciendo que sus informes de noticias sean más agradables para la audiencia y aumentando la fidelidad del usuario.
2.2 Principios de los algoritmos de recomendación de noticias
2.2.1 Elementos básicos de los algoritmos de recomendación de noticias
El algoritmo push tiene tres elementos básicos, a saber, usuarios, contenido y algoritmos. Los usuarios son los objetos de servicio del sistema de inserción de algoritmos. Cuanto más profundo sea el conocimiento y la comprensión de los usuarios, más preciso y eficaz será el método de clasificación de contenidos. El contenido es el material de producción básico del sistema de empuje de algoritmos. El análisis, organización, almacenamiento y distribución de diversas formas de comunicación requieren medios y métodos científicos. Los algoritmos son soporte técnico y el núcleo del impulso de algoritmos. La gran cantidad de usuarios en el sistema no puede igualar la enorme cantidad de información por sí sola, por lo que necesitamos un algoritmo de inserción para conectar a los usuarios y el contenido, actuar como un puente entre los usuarios y el contenido y recomendar de manera eficiente el contenido apropiado a los usuarios apropiados.
2.2.2 Principios básicos de los algoritmos de recomendación de noticias
La aparición del algoritmo push requiere dos condiciones: fuentes de información suficientes y un marco algorítmico preciso. Entre ellos, la fuente de producción de contenido del algoritmo está estrechamente relacionada con el efecto final de la distribución de la información: si hay suficiente información para rastrear y si la calidad de la información es suficiente para satisfacer a los usuarios tendrá un impacto en el efecto de difusión de la información. Al mismo tiempo, el vínculo de distribución también está retrocediendo, cambiando toda la ecología de la comunicación. Actualmente, existen tres tipos principales de algoritmos push que se utilizan en el campo de la comunicación de noticias nacional: push de filtrado colaborativo, push basado en contenido y push de reglas de asociación.
El filtrado colaborativo se divide en filtrado colaborativo basado en usuarios y filtrado colaborativo basado en modelos. El primero considera principalmente la similitud entre usuarios.
Siempre que descubra las categorías de artículos de noticias que les gustan a usuarios similares, prediga cuánto le gusta este artículo al usuario objetivo y luego recomiende otros artículos al usuario. Este último es similar al primero. La diferencia es que esta vez pasamos a buscar similitudes entre artículos. Solo descubriendo cuánto le gusta al usuario objetivo un determinado tipo de artículo podemos predecir artículos similares con alta similitud y recomendar artículos similares al usuario. Por lo tanto, el primero utiliza datos históricos del usuario para encontrar artículos push similares en toda la base de datos del usuario para su recomendación, mientras que el segundo construye un modelo de predicción a través de datos históricos del usuario y luego usa el modelo para predecir el push.
La inserción basada en contenido extrae y filtra características de información de texto según el historial del usuario, genera modelos y recomienda información similar a elementos históricos a los usuarios. Una de sus ventajas es que resuelve el problema de no poder juzgar con precisión la distribución cuando los datos son escasos en el filtrado colaborativo. Sin embargo, si las recomendaciones de información se basan únicamente en los datos históricos de los usuarios durante mucho tiempo, se producirá una personalización excesiva y se formará fácilmente un "capullo de información".
El impulso de reglas de asociación consiste en extraer las asociaciones detrás de los datos del usuario en función de los datos históricos del usuario, analizando así las necesidades potenciales del usuario y recomendando información que le pueda interesar. El proceso de recomendación de información basado en este algoritmo se divide principalmente en dos pasos. El primer paso es inferir el contenido que puede interesarle al usuario en función del contenido que el usuario actual ha leído. El segundo es ordenar el contenido según la importancia de las reglas y mostrárselo a los usuarios. El efecto del impulso de reglas de asociación depende de la cantidad y calidad de las reglas, pero a medida que aumenta el número de reglas, también aumentarán los requisitos del sistema.
2.2.3 Proceso de implementación del algoritmo push
En la era de la sobrecarga de información, hay muchos informes homogéneos sobre el mismo tema de noticias, por lo que el contenido de las noticias debe eliminarse antes de su publicación. , el contenido de noticias eliminado esperará a ser enviado. Hay tres tipos de empuje en este momento: empuje inicial, empuje expandido y empuje limitado.
La primera es comenzar a presionar al usuario con precisión, es decir, recomendarle el contenido actualizado de su cuenta de suscripción lo antes posible y luego clasificar características de texto similares de acuerdo con el. datos de navegación históricos del usuario y enviarlos a otros usuarios para finalmente recomendarlos a personas que siguen a usuarios similares. El segundo tipo de push extendido significa que el sistema filtrará automáticamente el contenido de noticias con tasas de clics y tiempos de lectura significativamente más altos que el promedio, y los recomendará a más personas. Sin embargo, en el proceso de ampliación de las recomendaciones, el sistema realizará ajustes en función de los comentarios de los usuarios. El tercero es limitar el envío, es decir, el contenido de noticias cuyo índice de clics y tiempo de lectura sean significativamente más bajos que el promedio será automáticamente descartado por el sistema y suprimido del envío, y se reducirá el alcance de dicho contenido.
3. Análisis del algoritmo de recomendación de noticias "Toutiao de hoy"
Toutiao de hoy es una plataforma de agregación de medios de información nacional, utilizada por más de 65.438+2 mil millones de personas todos los días. Desde "¡Lo que te importa es Toutiao!" hasta el actual "¡La información crea valor!" El cambio en el eslogan del producto también significa que Toutiao se está deshaciendo gradualmente del pensamiento de tráfico simple y crudo del pasado y está comenzando a centrarse en el conexión entre las personas y la información, y está promoviendo la difusión eficiente y precisa de la información. Al mismo tiempo, debemos prestar atención a la orientación de valores correcta.
A principios de 2018, el Dr. Cao Huanhuan, arquitecto senior de algoritmos de "Today's Toutiao", reveló el principio operativo de su algoritmo en una reunión para compartir. En su narración, presentó con gran detalle la descripción general del sistema de recomendación de algoritmos de "Today's Toutiao" y el principio de funcionamiento del sistema de recomendación de algoritmos.
Dr. Cao Huanhuan 3.1.1-1 Modelado algorítmico del Toutiao actual
La figura anterior utiliza un método matemático formal para describir el impulso del algoritmo del "Toutiao actual". es un algoritmo que puede obtener la función de satisfacción del contenido de los usuarios: es decir, Y es la satisfacción del usuario con el contenido, y Xu son las tres dimensiones impulsadas por el algoritmo Toutiao: es el usuario, incluido el sexo, la edad, ocupación, etiquetas de interés y otras descripciones de modelos de algoritmos Preferencias invisibles del usuario Xc es el entorno, que también es la característica del impulso de noticias en la era de Internet móvil. Debido a que los usuarios se mueven constantemente en cualquier momento y lugar, y los terminales móviles también se mueven, las preferencias de envío de información de los usuarios serán diferentes en diferentes lugares de trabajo, viajes y otros escenarios; Xu es contenido y Toutiao es una plataforma de agregación de información con diversas formas de contenido. Este capítulo analizará el algoritmo de recomendación de Toutiao uno por uno en función de esta función.
3.1 Una de las dimensiones recomendadas: análisis de contenido.
El análisis de contenido originalmente se refiere al trabajo de "Soldier Communication Research" organizado por el científico de la comunicación Lasswell y otros investigadores durante la Segunda Guerra Mundial, utilizando periódicos de guerra publicados en Alemania como objetos de investigación, aclarando los hechos esenciales y. tendencias del contenido de los periódicos, revelar contenido de información oculta, obtener una gran cantidad de información militar secreta y hacer predicciones de inteligencia sobre el desarrollo de la situación. En "Today's Toutiao", el análisis de contenido consiste en extraer elementos clave de artículos y videos, y clasificar el contenido mediante el reconocimiento semántico de palabras clave de títulos de texto y video. El sistema push de "Today's Toutiao" es un algoritmo típico de clasificación de texto jerárquico, que ayuda a cada noticia a encontrar la clasificación adecuada. Por ejemplo, la primera categoría importante es política, tecnología, finanzas, entretenimiento, deportes, etc. , los deportes se pueden dividir en baloncesto, fútbol, tenis, etc. , el fútbol se puede dividir en fútbol chino y el fútbol internacional se puede dividir en última instancia en A, Superliga china, selección nacional, etc. Este paso consiste en categorizar los artículos para poder recomendarlos a los clientes en el futuro.
Para lograr el efecto del análisis de contenido, se necesita una gran cantidad de información de contenido para proporcionar una selección y clasificación efectivas para el sistema de algoritmos. Dado que Toutiao se basa en algoritmos para impulsar las noticias, la base de datos detrás de él debe ser poderosa. "Web Spiders" y "Toutiao Accounts" son canales importantes que respaldan las fuentes de noticias de la plataforma Toutiao. Sus fuentes de noticias son extremadamente ricas y pueden capturar información de manera eficiente cuando y donde surjan nuevas situaciones.
La primera fuente de noticias son las "arañas web", también llamadas rastreadores web. Toutiao utiliza un rastreador de motor de búsqueda llamado "Bytespider". Puede capturar y extraer automáticamente información o scripts de Internet de acuerdo con ciertas reglas, como una araña que se alimenta de una telaraña. Cuando descubre nuevos recursos de información, la araña inmediatamente busca el contenido de la información y lo coloca en su propia base de datos. A diferencia de la búsqueda vertical de WeChat, Bytespider es un motor de búsqueda completamente nuevo que puede rastrear contenido de toda la web. Por lo tanto, el motor de búsqueda de "Today's Toutiao" tiene funciones integrales, amplios recursos de búsqueda y recursos altamente inclusivos.
El proceso básico de captura de información de Bytespider es el siguiente: 1. Captura de página web. Bytespider rastrea de un sitio web a otro a lo largo de los hipervínculos de las páginas web, visitando y rastreando constantemente más páginas web a través del análisis de hipervínculos. Las páginas web capturadas se denominan instantáneas web. Debido a que los hipervínculos se utilizan ampliamente en Internet, en teoría, la mayoría de las páginas web se pueden recopilar a partir de un cierto rango de páginas web. El segundo paso es procesar la página web. Después de que un motor de búsqueda captura una página web, necesita realizar una gran cantidad de trabajo de preprocesamiento antes de poder proporcionar servicios de recuperación. Entre ellos, lo más importante es extraer palabras clave y crear una base de datos y un índice. Otros incluyen eliminar páginas duplicadas, determinar el tipo de página, analizar hipervínculos y calcular la importancia y riqueza de las páginas. El tercer paso es proporcionar servicios de búsqueda. Los usuarios ingresan palabras clave para buscar y el motor de búsqueda encuentra páginas web que coinciden con las palabras clave de la base de datos del índice. Para comodidad de los usuarios, además del título y la URL de la página web, también se proporcionará información como resúmenes de la página web.
El segundo canal fuente es Toutiao. A diferencia de "Toutiao", es la plataforma de publicación de información profesional de Toutiao para medios, agencias estatales, empresas y medios propios. Comprometidos a ayudar a los productores a obtener más exposición y atención en Internet móvil de manera eficiente. En pocas palabras, la cuenta Toutiao significa que después de que los medios escriban y publiquen artículos y videos en ella, se mostrará en la plataforma Toutiao (incluida Toutiao Express Edition). A través del backend de la cuenta de Toutiao, los medios pueden ver la cantidad de recomendaciones, lecturas, lecturas de fans, comentarios, reenvíos y colecciones de artículos específicos. Finalmente, a través de estos comentarios cuantificables sobre el comportamiento de lectura del usuario, el sistema de algoritmo recomienda aún más contenido a los usuarios objetivo.
3.2 Dimensión de recomendación 2: Análisis del usuario
El análisis del usuario se realiza extrayendo datos efectivos del usuario, como los tipos de texto que los usuarios exploran con frecuencia, las palabras clave que se buscan con frecuencia y el contenido de información de registro, etc. , el sistema de algoritmo puede extraer las palabras clave del historial de navegación, el tiempo de navegación, los comentarios, el reenvío y otros comportamientos de cada usuario, y finalmente formar un retrato del usuario, de modo que los artículos y videos puedan enviarse con precisión a los usuarios en el futuro. Por ejemplo, los usuarios a los que les gusta ver "deportes" se etiquetan con "deportes"; los usuarios a los que les gusta "entretenimiento" se etiquetan con "entretenimiento". La función de este paso es modelar el interés del usuario, incluida la popularidad general de los artículos y videos del usuario, la popularidad de la categoría, la popularidad del tema y la popularidad de las palabras clave. La información actualizada en el gran sistema de recomendación puede resolver el problema del inicio en frío de las noticias y ayudar a impulsar las noticias.
El análisis de usuarios también tiene características colaborativas, lo que puede ayudar a resolver hasta cierto punto el llamado problema de los algoritmos cada vez más estrechos. Las funciones colaborativas, es decir, el método de inserción "asociativo", no solo consideran el historial existente del usuario, sino que también analizan las similitudes entre diferentes usuarios a través del comportamiento del usuario, como la similitud de clics, la similitud de clasificación de intereses, la similitud de temas y las palabras de interés. incluso similitud de vectores, ampliando así las capacidades de exploración del modelo. Según la similitud de los datos calculados entre los usuarios, los usuarios se dividen en diferentes grupos objetivo y luego el contenido de noticias que les interesa se envía a los grupos objetivo.
El análisis de contenidos y el análisis de usuarios se complementan. Si no hay etiquetas de texto analizadas, es imposible obtener etiquetas de interés del usuario. Si no hay etiquetas de interés del usuario, es imposible localizar a los usuarios y lograr un push preciso.
El tercer aspecto de las recomendaciones 3.3: análisis ambiental
El análisis ambiental consiste en enviar el artículo al usuario correspondiente en función de la puntualidad y la proximidad, como obtener si la ubicación actual del usuario es Zona de viaje, esto se puede lograr obteniendo la ubicación del usuario en tiempo real. También confirmará continuamente el estado actual comparándolo con los lugares donde el usuario ha aparecido anteriormente con frecuencia y analizará si el usuario se encuentra en un área permanente o de viaje. En este momento, si el sistema detecta que un usuario está jugando en Taishan y sus alrededores, puede enviar artículos relacionados con Taishan, noticias de tráfico circundantes, información meteorológica, etc.
A través de las tres dimensiones de recomendación anteriores, se puede utilizar como base de datos para analizar el entorno actual del usuario y hacer recomendaciones basadas en retratos de usuarios y clasificaciones de contenido de artículos para hacer que el contenido enviado sea lo más interesante posible. A través de la clasificación, análisis y extracción de contenido, el sistema de algoritmo eliminará la duplicación de artículos con alta similitud de texto, incluidos artículos con temas de noticias y contenido similares, resolverá el problema del envío repetido y recomendará contenido preciso y no duplicado a los usuarios objetivo. . Finalmente, filtra el contenido vulgar y pornográfico para evitar crear tendencias indeseables en la plataforma.
3.4 La orientación del valor del algoritmo de recomendación de noticias "Toutiao de hoy"
3.4.1 "El usuario primero"
El impulso del algoritmo de "Toutiao de hoy" se basa en la posición de los usuarios, para cumplir con la personalización del usuario y la precisión del empuje. "Today's Toutiao" también ha vuelto a medir el estándar del valor de las noticias: está orientado al usuario, y la satisfacción del usuario con el contenido de las noticias y los métodos de lectura es el propósito de valor del impulso de noticias de la plataforma. En la era de los medios tradicionales, sólo los periódicos y la televisión querían ver lo que la audiencia quería ver. Ahora el "Toutiao de hoy" se impulsa en función de los intereses de los usuarios. Las plataformas de inserción algorítmica tienen una amplia gama de usuarios, muchos de los cuales desean centrarse en la negatividad. También hay muchos usuarios que son voyeuristas y curiosos, les gustan los chismes aburridos y las noticias aburridas, y tienen una mentalidad de rebaño bajo la influencia de la curiosidad. Esto hace que los productores atiendan demasiado a la audiencia. Siempre que a los usuarios les guste verlo, pueden publicarlo en Toutiao.
3.4.2 "Orientado a algoritmos"
"Toutiao de hoy" presta más atención a la distribución técnica. Los productores son usuarios y las audiencias también son usuarios. son muy difíciles. El mecanismo de envío del algoritmo envía contenido según las preferencias del usuario. El contenido generado de esta manera es rápido y sin duda acelerará la eficiencia de la distribución del contenido. En el modelo de inserción de algoritmos, la frecuencia de clics del usuario, el tiempo de lectura, los me gusta y los comentarios, y el reenvío son objetivos cuantificables en la era de los algoritmos. Para el contenido generado en este caso, si desea obtener una mayor tasa de clics y tasa de empuje, necesita un título para atraer usuarios, porque lo que los usuarios pueden ver de un vistazo en la plataforma es el título y la imagen. Los títulos y las imágenes determinan si los usuarios abrirán su contenido, lo que ha llevado a muchos productores de contenido a caer en la trampa del clickbait al editar títulos de noticias. También ha llevado a la presentación de contenido vulgar, que guía a los usuarios a hacer clic creando conflictos y suspenso. etiquetas, con la intención de hacer que tus propios artículos sean un éxito. Para el contenido de información masiva, incluso si los datos y las recomendaciones inteligentes de Toutiao son muy buenos, actualmente es difícil resistir la enorme cantidad de información no deseada.
4. Problemas éticos causados por el empuje algorítmico de noticias.
En el pensamiento comunicacional actual en la era de Internet, la orientación al valor de las noticias de "usuario primero" y "liderazgo de algoritmos" se ha vuelto omnipresente en las plataformas de agregación de algoritmos. La tecnología de inserción de algoritmos se utiliza como un medio para atraer usuarios, crear un entorno mediático inductor y aumentar la adherencia de los usuarios a la plataforma. En comparación con el pasado, la tecnología de inserción de algoritmos ha logrado grandes avances en la obtención de información y la velocidad de difusión. Sin embargo, al mismo tiempo, debido a la incorporación de la tecnología de inserción de algoritmos, también han surgido nuevos problemas éticos que se vuelven cada vez más complejos.
4.1 Problemas éticos causados por el impulso de algoritmos
4.1.1 El impulso de algoritmos es demasiado mecánico y no tiene capacidad de pensamiento.
La recomendación de algoritmos unidireccionales a menudo trae problemas como contenido confuso, información excesiva y bajo valor de información para los usuarios. Lógicamente hablando, el algoritmo solo completa recomendaciones estadísticas basadas en búsquedas y coincidencias de palabras clave, y no puede garantizar la calidad del impulso al contenido artístico y profesional de reportajes informativos u obras literarias. El algoritmo actual se basa principalmente en coincidencias de recuperación y estadísticas, y se basa principalmente en tipos de información y etiquetas a las que las personas prestan atención, lo que dificulta lograr buenos efectos de inserción. Hay mil Hamlets a los ojos de mil personas, pero sólo hay un ordenador. La tecnología de algoritmos se centra demasiado en estadísticas mecanizadas y solo recomienda a los usuarios basándose en palabras clave. China tiene una profunda herencia cultural de caracteres chinos, y los algoritmos de recomendación están lejos de ser suficientes. Todo el cliente de noticias parece un mercado de verduras, sin actitud ni estilo, y la experiencia de lectura es única y fragmentada. Las noticias no sólo permiten a los usuarios comprender los últimos acontecimientos a su alrededor, sino que también promueven pensamientos positivos y difunden energía positiva. Las noticias también deberían traer a la gente nuevos pensamientos. Es fácil para una máquina emitir juicios correctos, pero es difícil para las máquinas emitir juicios sobre psicología, sociología o incluso las reglas de una determinada subdivisión y guiar a la audiencia correctamente. Así como la tecnología algorítmica no puede completar un informe en profundidad lleno de humanidad, literatura y criticidad, se limita a una comunicación fragmentada y superficial.
4.1.2 Es fácil provocar el efecto "capullo de información".
El concepto de "capullo de información" fue propuesto por Keith Sunstein en su libro "Information Utopia". Esto significa que la audiencia se encuentra en una excesiva autoselección de información, lo que reducirá la posibilidad de exposición a otra información del mundo exterior, limitando así sus vidas a una "habitación de gusanos de seda" similar a un capullo. El campo de información de las personas habitualmente se guiará por sus propios intereses. La reducción de la información conducirá a una única recepción de información por parte de la audiencia, lo que puede hacer que la audiencia caiga en un bucle e intensifique la homogeneidad de la información de la audiencia.
En los primeros días de la popularización de Internet, las audiencias obtenían información noticiosa principalmente de los principales medios de comunicación y portales web, y los principales medios de comunicación podían garantizar la calidad de las noticias. En cuanto a la adquisición de otra información, debido a limitaciones técnicas, la sala capullo no se amplificó demasiado en este momento y la audiencia tuvo una lectura adecuada, independiente y selectiva de las noticias. Sin embargo, en la era actual de la tecnología inteligente de Internet, la situación ha cambiado y el fenómeno del capullo de información se ha vuelto cada vez más evidente. Cuando se etiqueta a los usuarios, el sistema de algoritmos envía activamente una gran cantidad de información, lo que permite que la audiencia se convierta pasivamente en receptora de información. Los intereses de lectura de los usuarios no pueden cubrir todas las áreas del conocimiento. La lógica central de la distribución del algoritmo es hacer recomendaciones precisas basadas en los datos de comportamiento de los usuarios, pero al mismo tiempo, el algoritmo filtrará automáticamente la información "no interesado" y "no me gusta" para lograr "ver lo que quiero ver y escuchar". a lo que quiero escuchar." En este proceso, el poder de la tecnología algorítmica amplifica el efecto de selección de información del usuario, atrapando así a la audiencia en un capullo de información. Es difícil para la audiencia salir del capullo por sí solo, e incluso pueden sufrir más negativos sin saberlo. impacto.
4.1.3 “Pseudoneutralidad” del impulso del algoritmo
La objetividad y la exhaustividad son requisitos básicos de la ética periodística. Los periodistas deben obtener información real de buenas fuentes de información para poder adoptar una actitud objetiva. refleja la realidad. Solíamos creer que los proveedores de servicios de tecnología de Internet eran tecnológicamente neutrales y no necesitaban asumir la responsabilidad social de restringir a los medios de comunicación. Sin embargo, cuando los guardianes de la información y los editores de noticias se transforman en ingenieros de algoritmos, la ética de los medios tradicionales parece haberse vuelto ineficaz. Los algoritmos tienen tendencias comerciales, y la "neutralidad" es la razón por la que las plataformas de algoritmos evaden las responsabilidades de los medios, provocando un caos comunicacional en los medios de comunicación. Es más como el sofisma de las plataformas de algoritmos de "actuar al azar y no querer ser responsables".
Se han examinado las fuentes de información de la plataforma de algoritmos y el contenido de "Toutiao" representa la gran mayoría de todo el sistema de información de "Today's Toutiao". Sin embargo, en la era de "todos pueden ser reporteros", la plataforma Toutiao es un entorno de medios en línea abierto y existen muchos prejuicios y malentendidos. Ya sean las reglas del algoritmo establecidas por la plataforma "Toutiao" o las palabras clave capturadas por otros rastreadores, muchas fuentes de información en el sistema de algoritmos son información decidida, sesgada y no objetiva, por lo que las fuentes de información no pueden afectar directamente a los usuarios. Por lo tanto, en comparación con la edición manual tradicional, las fuentes de información de los sistemas de algoritmos de detección son extremadamente amplias y difíciles de verificar. Si el algoritmo se utiliza de forma maliciosa, se puede controlar fácilmente todo el sistema de comunicación.
4.1.4 "Configuración de agenda" en Algorithm Push
La connotación importante revelada por la función de configuración de agenda original es: "Aunque la visión de las noticias por parte de la audiencia se ve afectada por la función de configuración de agenda La dominancia de los medios de comunicación, pero más profundamente, es la amplificación y extensión que el establecimiento de la agenda trae a las noticias de los medios de masas, lo que permite a la audiencia hacer correcciones dinámicas a las elecciones de noticias y desarrollar gradualmente un sentido potencial de identidad para satisfacer las necesidades y la dependencia de los medios.
”
La aplicación de la tecnología de algoritmos push en las plataformas de Internet ha cambiado el proceso de establecimiento de agenda dominado por los medios tradicionales. La función de establecimiento de agenda ha evolucionado gradualmente con la transferencia de derechos de comunicación, el aumento de la participación pública, y el dramático aumento en la cantidad de información. En el pasado, el contenido de las noticias tradicionales era reportado selectivamente por los editores y luego presentado a la audiencia. Las noticias personalizadas permitían a los usuarios elegir qué contenido ver en este enlace. La tecnología permite a los usuarios pasar de los medios tradicionales a los contenidos informativos. La descentralización de los derechos de comunicación por parte de los usuarios de las plataformas hace que la conexión entre las audiencias y la sociedad ya no dependa de los medios tradicionales. El papel de guardián y la función de establecimiento de agenda de los medios informativos se están debilitando. p>
4.2 Derechos algorítmicos bajo las deficiencias de la gobernanza algorítmica de noticias. El algoritmo de alienación, como una de las piedras angulares de la inteligencia artificial, es "un método limitado, determinista y eficaz para resolver problemas, adecuado para programas informáticos, y es el "Con el gran avance de los algoritmos de aprendizaje profundo de la inteligencia artificial y la llegada de la era de los grandes datos, los escenarios de aplicación de la inteligencia artificial se están expandiendo constantemente. La era de la inteligencia artificial se está convirtiendo gradualmente en una realidad desde la imaginación, con la ayuda de big data masivos y potentes dispositivos de hardware mejoran continuamente sus capacidades a través del aprendizaje independiente y la capacitación intensiva para resolver muchos problemas de gobernanza que los humanos no pueden abordar de manera efectiva. A medida que aumenta la importancia de los algoritmos de energía artificial en la gobernanza nacional y social, el país y La sociedad pone más énfasis en los algoritmos. La dependencia se ha profundizado gradualmente y ha surgido una nueva forma de poder: el poder algorítmico se puede dividir en cuatro categorías: soberanía de los datos, derechos de diseño de algoritmos y derechos de capital de I+D. y los derechos de control del algoritmo, dado que los primeros tres derechos son unidireccionales, los desarrolladores del algoritmo entregan los derechos al algoritmo, que pertenece al desarrollador del algoritmo y no tiene ningún impacto directo en el efecto de la plataforma de distribución del algoritmo. sobre los derechos de control del algoritmo.
El control del algoritmo es bidireccional. Los usuarios son los proveedores de datos y el comportamiento de la tecnología de algoritmos y, al mismo tiempo, son víctimas del control de la tecnología de algoritmos. Hemos visto que "Toutiao" monitorea el comportamiento de publicación y navegación de los usuarios a través de algoritmos push. La plataforma publica contenido a través de un sistema algorítmico de toma de decisiones y guía a los usuarios. El control algorítmico es, por supuesto, un derecho otorgado por la tecnología natural, pero solo puede serlo. se realiza cuando los usuarios proporcionan datos. Por lo tanto, el control algorítmico no solo tiene el derecho de producir contenido, sino que también tiene el derecho de controlar el contenido. Respetar y proteger las obligaciones de los algoritmos hacia los humanos. La tecnología se considera un arma de doble filo. Por un lado, los algoritmos pueden hacer predicciones de comportamiento precisas y proporcionar a los administradores muy buenos resultados. Para los actores públicos, los problemas de gobernanza social pueden resolverse mediante la aplicación de big data. para los actores privados, se pueden proporcionar servicios personalizados con la ayuda de datos; por otro lado, la tecnología de algoritmos tiene beneficios y riesgos asimétricos y, debido al alto desarrollo de la tecnología de algoritmos, los creadores de nuevas tecnologías tienen información asimétrica. y ventajas tecnológicas y pueden moldear la lógica de empuje del algoritmo y el sistema social en la plataforma de acuerdo con sus propios intereses, generando incertidumbre regulatoria. Regular los derechos algorítmicos a través de acciones colectivas para asumir la responsabilidad social puede permitirnos pensar más profundamente sobre el significado y el valor de. Sistemas de distribución algorítmicos.