Ripubblicato da Platone

Seguaci: 0

Dietro OpenAI Codex: 5 affascinanti sfide sulla creazione di Codex che non conoscevi

= Post precedente

Tag: Codice, NLP, OpenAI

Alcune sfide di ingegneria e modellazione ML incontrate durante la costruzione del Codex.

By Gesù Rodriguez, Nel blocco.

Commenti

Fonte: https://bdtechtalks.com/2021/07/15/openai-codex-ai-programming/

Un paio di settimane fa, OpenAI ha stupito il mondo dell'intelligenza artificiale (AI) con il rilascio di Codex, un enorme modello in grado di tradurre il linguaggio naturale in codice. Codex può generare efficacemente end-to-end dalle istruzioni linguistiche di base. Se non mi credi, dovresti guardare questo video che può essere considerato uno dei migliori demo AI di tutti i tempi 😉

Credito video: OpenAI

Molto è stato scritto sulle capacità del Codex dal suo lancio iniziale.

Tuttavia, sono stato più incuriosito dai piccoli requisiti che diventano incredibilmente rilevanti per costruire un modello di questa portata. Approfondendo il Codex, ci sono alcune cose interessanti che ho trovato che sarebbe stato utile evidenziare:

1. Codex è esperto in circa una dozzina di lingue ma è stato addestrato per Python

Ho trovato questo incredibilmente perspicace. L'obiettivo originale di OpenAI era rendere il Codex esperto in Python, ma si scopre che il modello ha raccolto altri linguaggi durante il processo di pre-addestramento. Questo parla delle capacità uniche dei modelli linguistici pre-addestrati.

2. Testare il Codex è stato più che complicato

La comunità di intelligenza artificiale è rimasta stupita dalla ricerca alla base del Codex, ma penso che il lato ingegneristico sia stato altrettanto impressionante. Un aspetto che mi ha particolarmente incuriosito è stata la parte di test. Come si fa a testare il codice live senza correre rischi enormi. Si scopre che il team di OpenAI ha lavorato molto per creare sandbox molto sofisticati per testare gli output del Codex in isolamento.

3. Abbinare la semantica al codice è tutt'altro che banale

Addestrare un modello in tutto il codice sorgente del mondo suona bene ma è tutt'altro che banale. Dopotutto, non tutto il codice è uguale. Il codice in Github può essere scarsamente documentato mentre i notebook possono avere ricche informazioni semantiche. Allo stesso modo, i frammenti di codice in Stack Overflow hanno livelli più ricchi di informazioni semantiche. La mappatura delle sezioni di codice alla semantica del linguaggio è stata una delle sfide della creazione del Codex.

4. Il Codex lotta ancora con la scomposizione dei compiti

Se pensi a come funzionano i programmatori, tendiamo a scomporre un problema in attività più piccole e a produrre codice per quelle. Si scopre che Codex è eccezionale in quest'ultimo, ma fa ancora fatica nei compiti di scomposizione dei problemi. Questo non dovrebbe sorprendere se pensiamo che la scomposizione del problema richiede abilità cognitive molto complesse.

5. La messa a punto supervisionata è stata una parte importante della costruzione del Codex

Il codice in Internet appare in tutti i tipi di livelli di completezza, documentazione, ricchezza sintattica, ecc. L'addestramento di un modello in insiemi di codici così diversi può produrre risultati inaffidabili. In questo senso OpenAI ha dovuto subire un enorme sforzo di messa a punto supervisionato.

Questi sono alcuni degli aspetti del Codex che non sono molto conosciuti ma che hanno contribuito maggiormente al successo della prima versione del modello. Il successo del Codex è dovuto sia alla ricerca avanzata sul machine learning che a enormi sforzi di ingegneria e infrastruttura del machine learning.

Bio: Gesù Rodriguez è attualmente CTO presso Intotheblock. È un esperto di tecnologia, investitore esecutivo e consulente di startup. Jesus ha fondato Tellago, una pluripremiata società di sviluppo software focalizzata nell'aiutare le aziende a diventare grandi organizzazioni di software sfruttando le nuove tendenze del software aziendale.

Originale. Ripubblicato con il permesso.

Correlato:

= Post precedente

Le migliori storie degli ultimi 30 giorni

Più popolare
La differenza tra data scientist e ingegneri ML 3 motivi per cui dovresti usare modelli di regressione lineare invece di reti neurali Domande e risposte per le interviste più comuni sulla scienza dei dati Alternative open source di GitHub Copilot Consigli per l'apprendimento della scienza dei dati dal direttore della ricerca di Google

La maggior parte in comune
La differenza tra data scientist e ingegneri ML Come interrogare il tuo dataframe Panda Perché e come dovresti imparare la "scienza dei dati produttivi"? Non solo per il deep learning: come le GPU accelerano la scienza dei dati e l'analisi dei dati Scrivere la tua prima applicazione Python distribuita con Ray

Fonte: https://www.kdnuggets.com/2021/09/openai-codex-challenges.html

Timestamp: 3 settembre 2021

Di più da KDnuggets

Come ho creato l'etichettatura automatica delle immagini utilizzando Grounding DINO – KDnuggets

KDnuggets

Nodo di origine: 1981981

Timestamp: Febbraio 27, 2023

Impara l'apprendimento automatico da questi repository GitHub

Cluster di origine:

KDnuggets

Nodo di origine: 1932118

Timestamp: Gennaio 31, 2023

Dietro OpenAI Codex: 5 affascinanti sfide sulla creazione di Codex che non conoscevi

Ripubblicato da Platone

Dietro OpenAI Codex: 5 affascinanti sfide sulla creazione di Codex che non conoscevi

1. Codex è esperto in circa una dozzina di lingue ma è stato addestrato per Python

2. Testare il Codex è stato più che complicato

3. Abbinare la semantica al codice è tutt'altro che banale

4. Il Codex lotta ancora con la scomposizione dei compiti

5. La messa a punto supervisionata è stata una parte importante della costruzione del Codex

Di più da KDnuggets

Come ho creato l'etichettatura automatica delle immagini utilizzando Grounding DINO – KDnuggets

Come creare un dashboard interattivo in tre passaggi con la piattaforma di analisi KNIME

Svelare la magia neurale: un tuffo nelle funzioni di attivazione – KDnuggets

Super Bard: l'intelligenza artificiale che può fare tutto e meglio - KDnuggets

Esecuzione gratuita di Mixtral 8x7b su Google Colab – KDnuggets

Costruire una rete neurale convoluzionale con PyTorch – KDnuggets

Post più importanti 20-26 febbraio: 5 strumenti di visualizzazione SQL per ingegneri di dati

Impara l'apprendimento automatico da questi repository GitHub

Chi siamo

Ricerca verticale e Ai

Piattaforma

Rimani in contatto

Il mio account