La Red de Conocimientos Pedagógicos - Currículum vitae - Nombre completo de Caht gpt

Nombre completo de Caht gpt

Nombre completo de Caht gpt: Convertidor preentrenado de generación de chat

1 Introducción. ChatGPT Chatbot

ChatGPT es un programa de chatbot de inteligencia artificial desarrollado por OpenAI, que se lanzó en junio de 2022 y 165438 de octubre. El programa utiliza un modelo de lenguaje grande basado en la arquitectura GPT 3.5 y se entrena mediante aprendizaje por refuerzo.

Actualmente, ChatGPT todavía interactúa con texto, pero se puede utilizar para trabajos de lenguaje relativamente complejos. Además del diálogo humano natural, también incluye generación automática de texto, preguntas y respuestas automáticas, resumen automático, etc.

Por ejemplo, en la generación automática de texto, ChatGPT puede generar automáticamente textos similares (guiones, canciones, planos, etc.) y generar automáticamente respuestas basadas en el texto ingresado. En preguntas y respuestas automáticas, ChatGPT puede hacerlo automáticamente. generar respuestas basadas en las preguntas ingresadas Generar respuestas automáticamente. También tiene la capacidad de escribir y depurar programas informáticos.

Durante el período de promoción, todos pueden registrarse de forma gratuita y usar ChatGPT para hablar con el robot de IA de forma gratuita después de iniciar sesión.

ChatGPT es capaz de escribir artículos a un nivel humano y rápidamente llamó la atención porque proporciona respuestas detalladas y claras en muchas áreas del conocimiento, lo que demuestra que también es capaz de realizar tareas que antes se pensaba que Los empleos basados ​​en el conocimiento reemplazados por la IA también tendrán un impacto considerable en los mercados financieros y laborales, pero su precisión fáctica desigual se considera un defecto importante.

Es el resultado de un entrenamiento basado en modelos mentales y se considera que necesita una revisión seria. Después del lanzamiento de ChatGPT en junio de 2022, la valoración de OpenAI aumentó a 29 mil millones de dólares [7]. Dos meses después de su lanzamiento, el número de usuarios alcanzó los 654.380 millones.

2. ¿Cómo entrena ChatGPT los datos?

ChatGPT utiliza aprendizaje supervisado y aprendizaje reforzado basado en comentarios humanos para perfeccionar GPT-3.5. Ambos métodos utilizan entrenadores humanos para mejorar el rendimiento del modelo, aumentando el aprendizaje automático con intervención humana para lograr resultados más realistas.

En el caso del aprendizaje supervisado, el modelo cuenta con un diálogo, en el que el formador J desempeña el papel de usuario y asistente de IA. En el paso de refuerzo, el entrenador humano primero califica las respuestas que el modelo produjo en conversaciones anteriores.

Estos niveles se utilizan para crear un "modelo de recompensa" que se perfecciona aún más mediante múltiples iteraciones de optimización aproximada de políticas (PPO).

Este algoritmo de optimización de políticas es más efectivo que el algoritmo de optimización de políticas de región de confianza. Los modelos fueron entrenados en asociación con Microsoft en su infraestructura de supercomputación Microsoft Azure.

Además, OpenAI continúa recopilando datos de los usuarios de ChatGPT, que pueden usarse para capacitación adicional y ajuste de ChatGPT. Permite a los usuarios votar hacia arriba o hacia abajo en las respuestas que reciben de ChatGPT. Al votar hacia arriba o hacia abajo, también pueden completar un campo de texto con comentarios adicionales.

Los datos de capacitación de ChatGPT incluyen varios documentos y diversos conocimientos sobre Internet y lenguajes de programación, como BBS y el lenguaje de programación Python.

En cuanto al entrenamiento de la capacidad de ChatGPT para escribir y depurar programas informáticos, el modelo de aprendizaje profundo es el mismo que todos los demás modelos de lenguaje basados ​​en aprendizaje profundo, obteniendo únicamente correlaciones estadísticas entre fragmentos de código.