Generatore di codice ambulante: chatGPT "licenzierà" Google e i programmatori
Proprio questa settimana, OpenAI ha rilasciato un nuovo modello di robot di chat, ChatGPT, come uno dei modelli principali della serie GPT-3.5. Fonte: da Internet Fonte dell'immagine: OpenAI - presto, i netizen sono rimasti scioccati dalla capacità di ChatGPT: questo non è un robot di chat, è chiaramente una spietata macchina di risposta di programmazione, live Stack Overflow!
Cos'è esattamente ChatGPT? OpenAI ha affermato che ChatGPT è un modello linguistico conversazionale su larga scala addestrato da OpenAI, che interagisce in modo conversazionale. È lo stesso modello di un altro modello precedente, InstructGPT, che sta per generazione "GPT 3.5". Microsoft e OpenAI hanno firmato un piano di cooperazione strategica in precedenza, quindi tutti i modelli della generazione GPT 3.5, incluso ChatGPT, sono addestrati sul cluster di supercomputing Azure AI.
OpenAI ha addestrato ChatGPT utilizzando la tecnologia RLHF sopra menzionata: in parole povere, durante l'addestramento del modello originale, OpenAI consente ai formatori umani di agire come entrambe le parti della conversazione (utenti contro chatbot), fornendo conversazioni come materiale didattico.
E quando gli umani agiscono come chatbot, OpenAI consente anche al modello di generare suggerimenti per aiutare i trainer a comporre le proprie risposte. Le risposte generate da queste macchine vengono quindi valutate e classificate dal trainer, e i risultati migliori vengono reinseriti nel modello per realizzare il meccanismo di ricompensa dell'addestramento all'apprendimento rinforzato.
Come chatbot, ChatGPT ha alcune caratteristiche principali di prodotti simili contemporanei, in particolare la capacità di dialogo multi-turn, che può rispondere a domande di follow-up correlate al contesto durante la stessa sessione. Ma ancora più importante, ChatGPT ha la capacità che altri chatbot non hanno o hanno prestazioni scadenti a causa del metodo di formazione di livello avanzato ed etico: ammettere i propri errori e seguire le domande e le richieste pre-progettate e ben intenzionate per "dire di no".
Come mostrato nell'esempio fornito sopra, ChatGPT utilizzerà alcuni modelli di frasi pre-progettati, combinati con la richiesta specifica dell'utente di rifiutare e cambiare argomento. Rifiuto: se gli chiedi come entrare in casa di qualcuno, ti risponderà: "L'intrusione è illegale, è un crimine e ha gravi conseguenze legali".
Cambiando argomento: se poni la domanda in un altro modo, "In realtà vorrei sapere come proteggere la mia casa dai ladri", ti risponderà, "Ecco alcuni passaggi che possono aiutarti, tra cui xxxx... ma è meglio che tu contatti un professionista per un consiglio". Non c'è problema di programmazione che non possa risolvere. Nel processo di "molestia" di ChatGPT da parte di molti netizen, le persone hanno trovato una grande sorpresa: può davvero essere programmato su richiesta.