Cosa offrono i nuovi modelli di incorporamento OpenAI?

Cosa offrono i nuovi modelli di incorporamento OpenAI?

Nodo di origine: 3084949

Il regno dell'intelligenza artificiale continua ad evolversi con i nuovi modelli di incorporamento OpenAI. Sono destinati a ridefinire il modo in cui gli sviluppatori affrontano l'elaborazione del linguaggio naturale. Prima di esplorare i due modelli rivoluzionari, ciascuno progettato per migliorare le capacità delle applicazioni IA, ecco cosa incastri significare:

Gli incorporamenti di testo di OpenAI fungono da metrica per valutare la correlazione tra stringhe di testo, trovando applicazioni in vari domini, tra cui:

  • Cerca: utilizzato per classificare i risultati in base alla loro rilevanza per una determinata stringa di query, migliorando la precisione dei risultati della ricerca.
  • il clustering: Utilizzato per raggruppare stringhe di testo in base alle loro somiglianze, facilitando l'organizzazione delle informazioni correlate.
  • raccomandazioni: applicato nei sistemi di raccomandazione per suggerire elementi che condividono punti comuni nelle stringhe di testo, migliorando la personalizzazione dei suggerimenti.
  • Rilevazione di anomalie: Impiegato per identificare valori anomali con correlazione minima, aiutando nel rilevamento di modelli o punti dati irregolari.
  • Misurazione della diversità: Utilizzato per analizzare le distribuzioni di somiglianza, consentendo la valutazione della diversità all'interno di set di dati o corpora di testo.
  • Classificazione: distribuito in attività di classificazione in cui le stringhe di testo vengono classificate in base all'etichetta più simile, semplificando il processo di etichettatura nelle applicazioni di machine learning.

Ora sei pronto per esplorare i nuovi modelli di incorporamento OpenAI!

Sono arrivati ​​i nuovi modelli di incorporamento OpenAI

L'introduzione dei nuovi modelli di incorporamento OpenAI segna un passo avanti significativo nell'elaborazione del linguaggio naturale, consentendo agli sviluppatori di rappresentare e comprendere meglio i contenuti testuali. Entriamo nel dettaglio di questi modelli innovativi: incorporamento del testo-3-piccolo ed text-embedding-3-large.

Scopri i nuovi modelli di incorporamento OpenAI: text-embedding-3-small e text-embedding-3-large: convenienza, prestazioni migliorate e altro ancora!
I nuovi modelli di incorporamento OpenAI, text-embedding-3-small e text-embedding-3-large, mostrano progressi significativi nell'elaborazione del linguaggio naturale, soddisfacendo le diverse esigenze degli sviluppatori (Immagine di credito)

incorporamento del testo-3-piccolo

Questo modello compatto ma potente mostra un notevole incremento delle prestazioni rispetto al suo predecessore, text-embedding-ada-002. Nel benchmark di recupero multilingue (MIRACL), il punteggio medio è salito dal 31.4% a un impressionante 44.0%. Allo stesso modo, nel benchmark dei compiti inglesi (MTEB), il punteggio medio ha visto un encomiabile aumento dal 61.0% al 62.3%. Tuttavia, ciò che distingue text-embedding-3-small non sono solo le sue prestazioni migliorate ma anche la sua convenienza.

Punto di riferimento di valutazione ada v2 incorporamento del testo-3-piccolo text-embedding-3-large
Media MIRACL 31.4 44.0 54.9
Media MTEB 61.0 62.3 64.6

OpenAI ha ridotto significativamente i prezzi, rendendolo 5 volte più conveniente rispetto a text-embedding-ada-002, con il prezzo per token da 1 ridotto da $ 0.0001 a $ 0.00002. Ciò rende text-embedding-3-small non solo una scelta più efficiente ma anche più accessibile per gli sviluppatori.

text-embedding-3-large

Rappresentando la prossima generazione di modelli di incorporamento, text-embedding-3-large introduce un sostanziale aumento delle dimensioni, supportando incorporamenti con un massimo di 3072 dimensioni. Questo modello più ampio fornisce una rappresentazione più dettagliata e sfumata del contenuto testuale. In termini di prestazioni, text-embedding-3-large supera il suo predecessore nei benchmark. Su MIRACL, il punteggio medio è passato dal 31.4% a un impressionante 54.9%, evidenziando la sua abilità nel recupero multilingue.

ada v2 incorporamento del testo-3-piccolo text-embedding-3-large
Dimensioni di incorporamento 1536 512 1536 256 1024 3072
Punteggio medio MTEB 61.0 61.6 62.3 62.0 64.1 64.6

Allo stesso modo, su MTEB, il punteggio medio è salito dal 61.0% al 64.6%, dimostrando la sua superiorità nei compiti di inglese. Con un prezzo di 0.00013 dollari per 1 token, text-embedding-3-large raggiunge un equilibrio tra eccellenza delle prestazioni e convenienza, offrendo agli sviluppatori una soluzione solida per le applicazioni che richiedono incorporamenti ad alta dimensione.


Soddisfare Google Lumière AI, cugino videomaker di Bard


Supporto nativo per abbreviare gli incorporamenti

Riconoscendo le diverse esigenze degli sviluppatori, OpenAI introduce il supporto nativo per abbreviare gli incorporamenti. Questa tecnica innovativa consente agli sviluppatori di personalizzare le dimensioni di incorporamento regolando il parametro API delle dimensioni. In questo modo, gli sviluppatori possono sacrificare alcune prestazioni per una dimensione vettoriale più piccola senza compromettere le proprietà fondamentali dell'incorporamento. Questa flessibilità è particolarmente preziosa negli scenari in cui i sistemi supportano solo incorporamenti fino a una certa dimensione, fornendo agli sviluppatori uno strumento versatile per vari scenari di utilizzo.

Scopri i nuovi modelli di incorporamento OpenAI: text-embedding-3-small e text-embedding-3-large: convenienza, prestazioni migliorate e altro ancora!
L'accessibilità economica di text-embedding-3-small è sottolineata da una riduzione dei prezzi di 5 volte rispetto al suo predecessore, text-embedding-ada-002, rendendolo una scelta conveniente per gli sviluppatori (Immagine di credito)

In sintesi, i nuovi modelli di incorporamento di OpenAI rappresentano un significativo passo avanti in termini di efficienza, convenienza e prestazioni. Sia che gli sviluppatori optino per la rappresentazione compatta ma efficiente di text-embedding-3-small o per gli incorporamenti più estesi e dettagliati di text-embedding-3-large, questi modelli forniscono agli sviluppatori strumenti versatili per estrarre informazioni più approfondite dai dati testuali nella loro intelligenza artificiale. applicazioni.

Per informazioni più dettagliate sui nuovi modelli di incorporamento OpenAI, fare clic su qui e ricevi l'annuncio ufficiale.

Credito immagine in primo piano: Levart_Photographer/Unsplash

Timestamp:

Di più da Economia dei dati