Generador de códigos ambulantes: chatGPT "despedirá" a Google y a los programadores
Esta misma semana, OpenAI lanzó un nuevo modelo de robot de chat, ChatGPT, como uno de los modelos principales de la serie GPT-3.5. Fuente: de Internet Fuente de la imagen: OpenAI: pronto, los internautas se sorprendieron por la capacidad de ChatGPT: este no es un robot de chat, es claramente un contestador automático de programación despiadado, ¡Stack Overflow en vivo!
¿Qué es exactamente ChatGPT? OpenAI dijo que ChatGPT es un modelo de lenguaje conversacional a gran escala entrenado por OpenAI, que interactúa de manera conversacional. Es el mismo modelo que otro modelo anterior, InstructGPT, que significa generación "GPT 3.5". Microsoft y OpenAI firmaron anteriormente un plan de cooperación estratégica, por lo que todos los modelos de la generación GPT 3.5, incluido ChatGPT, están entrenados en el clúster de supercomputación Azure AI.
OpenAI entrenó ChatGPT utilizando la tecnología RLHF antes mencionada: en pocas palabras, al entrenar el modelo original, OpenAI permite que los entrenadores humanos actúen como ambos lados de la conversación (usuarios frente a chatbots), proporcionando conversaciones como materiales de aprendizaje.
Y cuando los humanos actúan como chatbots, OpenAI también permite que el modelo genere sugerencias para ayudar a los formadores a redactar sus propias respuestas. Luego, el entrenador califica y clasifica las respuestas generadas por estas máquinas, y los mejores resultados se ingresan nuevamente en el modelo para realizar el mecanismo de recompensa del entrenamiento de aprendizaje por refuerzo.
Como chatbot, ChatGPT tiene algunas características principales de productos similares contemporáneos, especialmente la capacidad de diálogo en múltiples turnos, que puede responder preguntas de seguimiento relacionadas con el contexto durante la misma sesión. Pero lo más importante es que ChatGPT tiene la capacidad que otros chatbots no tienen o funcionan mal debido al método de entrenamiento avanzado y de nivel ético: admitir sus errores y seguir las preguntas y solicitudes prediseñadas “bien intencionadas” para “decir no”.
Como se muestra en el ejemplo proporcionado anteriormente, ChatGPT utilizará algunos patrones de oraciones prediseñadas, combinados con la solicitud específica del usuario de rechazar y cambiar el tema. Rechazo: Si le preguntas cómo entrar en casa de alguien, te responderá: "Entrar ilegalmente es ilegal, es un delito y tiene graves consecuencias legales".
Cambiando de tema: Si planteas la pregunta de otra manera, "En realidad quiero saber cómo proteger mi casa de los ladrones", te responderá: "Aquí hay algunos pasos que pueden ayudarte, incluido xxxx...pero Es mejor que contactes a un profesional para que te aconseje." No hay problema de programación que no pueda resolver. En el proceso de "abusar sexualmente" de ChatGPT por parte de muchos internautas, la gente encontró una gran sorpresa: realmente se puede programar bajo demanda.