Imaginile sintetice pot ajuta modelele de inteligență artificială să învețe reprezentările vizuale mai precis în comparație cu fotografiile reale, potrivit informaticienilor de la MIT și Google. Rezultatul sunt rețele neuronale care sunt mai bune la realizarea de imagini din descrierile tale scrise.
În centrul tuturor modelelor text-to-image se află capacitatea lor de a mapa obiecte în cuvinte. Având în vedere un mesaj text de introducere – cum ar fi „un copil care ține un balon roșu într-o zi însorită”, de exemplu – ar trebui să returneze o imagine care să aproximeze descrierea. Pentru a face acest lucru, ei trebuie să învețe reprezentările vizuale ale cum ar putea arăta un copil, un balon roșu și o zi însorită.
Echipa MIT-Google consideră că rețelele neuronale pot genera imagini mai precise din solicitări după ce au fost antrenate pe imagini realizate cu inteligență artificială, spre deosebire de utilizarea imaginilor reale. Pentru a demonstra acest lucru, grupul s-a dezvoltat StableRep, care învață cum să transforme legendele scrise descriptive în imagini corespunzătoare corecte din imagini generate de popularul model open source text-to-image Stable Diffusion.
Cu alte cuvinte: folosirea unui model AI stabilit și instruit pentru a preda alte modele.
Ca hârtie de pre-tipărire a oamenilor de știință, lansată prin arXiv la sfârșitul lunii trecute, spune: „Cu imagini exclusiv sintetice, reprezentările învățate de StableRep depășesc performanța reprezentărilor învățate de SimCLR și CLIP folosind același set de prompturi de text și imagini reale corespunzătoare, pe seturi de date la scară largă.” SimCLR și CLIP sunt algoritmi de învățare automată care pot fi utilizați pentru a crea imagini din mesaje text.
„Când adăugăm în continuare supravegherea limbajului, StableRep antrenat cu 20 de milioane de imagini sintetice atinge o acuratețe mai bună decât CLIP antrenat cu 50 de milioane de imagini reale”, continuă lucrarea.
Algoritmii de învățare automată captează relațiile dintre trăsăturile obiectelor și semnificațiile cuvintelor ca o matrice de numere. Folosind StableRep, cercetătorii pot controla acest proces cu mai multă atenție – antrenând un model pe mai multe imagini generate de Stable Diffusion la același prompt. Înseamnă că modelul poate învăța reprezentări vizuale mai diverse și poate vedea ce imagini se potrivesc mai bine cu solicitările decât altele.
Cred că vom avea un ecosistem de niște modele antrenate pe date reale, unele pe sintetice
„Învățăm modelul să învețe mai multe despre concepte de nivel înalt prin context și varianță, nu doar prin furnizarea de date”, Lijie Fan, cercetător principal al studiului și doctorand în inginerie electrică la MIT. a explicat în această săptămână. „Atunci când folosește mai multe imagini, toate generate din același text, toate tratate ca reprezentări ale aceluiași lucru subiacent, modelul se scufundă mai adânc în conceptele din spatele imaginilor – să spunem obiectul – nu doar pixelii acestora.”
După cum s-a menționat mai sus, această abordare înseamnă, de asemenea, că puteți utiliza mai puține imagini sintetice pentru a vă antrena rețeaua neuronală decât cele reale și să obțineți rezultate mai bune – ceea ce este de câștig pentru dezvoltatorii AI.
Metode precum StableRep înseamnă că modelele text-to-image pot fi într-o zi instruite pe date sintetice. Ar permite dezvoltatorilor să se bazeze mai puțin pe imagini reale și ar putea fi necesar dacă motoarele AI epuizează resursele online disponibile.
„Cred că [formarea modelelor AI pe imagini sintetice] va fi din ce în ce mai comună”, a declarat Phillip Isola, coautor al lucrării și profesor asociat de viziune computerizată la MIT. Registrul. „Cred că vom avea un ecosistem format din unele modele instruite pe date reale, unele pe sintetice și poate că majoritatea modelelor vor fi antrenate pe ambele.”
Este dificil să te bazezi doar pe imaginile generate de inteligență artificială, deoarece calitatea și rezoluția lor este adesea mai slabă decât fotografiile reale. Modelele text-to-image care le generează sunt limitate și în alte moduri. Difuziunea stabilă nu produce întotdeauna imagini care sunt fidele solicitărilor de text.
Isola a avertizat că utilizarea imaginilor sintetice nu exclude nici potențiala problemă a încălcării drepturilor de autor, deoarece modelele care le-au generat au fost probabil instruite pe materiale protejate.
„Datele sintetice ar putea include copii exacte ale datelor privind drepturile de autor. Cu toate acestea, datele sintetice oferă, de asemenea, noi oportunități pentru a ocoli problemele de IP și confidențialitate, deoarece putem interveni potențial asupra lor, prin editarea modelului generativ pentru a elimina atributele sensibile”, a explicat el.
Echipa a avertizat, de asemenea, că sistemele de instruire privind imaginile generate de AI ar putea exacerba părtinirile învățate de modelul lor subiacent text-to-image. ®
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://go.theregister.com/feed/www.theregister.com/2023/11/22/texttoimage_models_mit/
- :este
- :nu
- 20
- 50
- a
- capacitate
- Despre Noi
- mai sus
- Conform
- precizie
- precis
- precis
- Realizeaza
- adăuga
- După
- AI
- Modele AI
- algoritmi
- TOATE
- permite
- de asemenea
- mereu
- an
- și
- abordare
- SUNT
- în jurul
- Mulțime
- AS
- Avocat Colaborator
- At
- atribute
- disponibil
- BE
- deoarece
- în spatele
- fiind
- consideră că
- Mai bine
- între
- distorsiunilor
- atât
- by
- CAN
- legende
- captura
- cu grijă
- copil
- îndeaproape
- CO
- Coautor
- Comun
- comparație
- calculator
- Computer Vision
- Concepte
- context
- continuă
- Control
- copii
- drepturi de autor
- încălcarea drepturilor de autor
- corecta
- Corespunzător
- ar putea
- de date
- seturi de date
- zi
- Mai adânc
- demonstra
- descriere
- dezvoltat
- Dezvoltatorii
- dificil
- difuziune
- diferit
- do
- nu
- ecosistem
- editare
- eficient
- oricare
- Inginerie Electrică
- capăt
- Inginerie
- Motoare
- stabilit
- Eter (ETH)
- exacerba
- exemplu
- a explicat
- credincios
- fals
- ventilator
- DESCRIERE
- hrănire
- mai puține
- Pentru
- din
- mai mult
- genera
- generată
- generator
- generativ
- model generativ
- obține
- obtinerea
- dat
- grup
- Avea
- he
- inimă
- ajutor
- la nivel înalt
- deținere
- Cum
- Cum Pentru a
- Totuși
- HTTPS
- i
- if
- imagine
- imagini
- in
- În altele
- include
- tot mai mult
- încălcare
- intrare
- interveni
- în
- IP
- problema
- probleme de
- IT
- jpg
- doar
- limbă
- mare
- Nume
- conduce
- AFLAȚI
- învățat
- mai puțin
- ca
- Probabil
- Limitat
- Uite
- arată ca
- face
- Efectuarea
- Hartă
- Meci
- Materiale
- Mai..
- poate
- însemna
- sensuri
- mijloace
- ar putea
- milion
- MIT
- model
- Modele
- Lună
- mai mult
- cele mai multe
- multiplu
- necesar
- Nevoie
- reţea
- rețele
- neural
- rețele neuronale
- rețele neuronale
- Nou
- notat
- numere
- obiect
- obiecte
- of
- de multe ori
- on
- ONE
- cele
- on-line
- deschide
- open-source
- Oportunităţi
- opus
- comandă
- Altele
- Altele
- Hârtie
- performanță
- PhD
- fotografii
- poze
- Plato
- Informații despre date Platon
- PlatoData
- Popular
- potenţial
- potenţial
- intimitate
- proces
- produce
- Profesor
- solicitări
- protejat
- furnizează
- puts
- calitate
- RE
- real
- Roșu
- Relaţii
- eliberat
- se bazează
- scoate
- cercetător
- cercetători
- Rezoluţie
- Resurse
- rezultat
- REZULTATE
- reveni
- s
- acelaşi
- Spune
- Scară
- oamenii de stiinta
- vedea
- sensibil
- set
- să
- întrucât
- Numai
- unele
- Sursă
- stabil
- student
- Studiu
- astfel de
- supraveghere
- depăși
- sintetic
- date sintetice
- sisteme
- T
- Predarea
- echipă
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- decât
- acea
- lor
- Lor
- ei
- lucru
- crede
- acest
- în această săptămână
- Prin
- la
- a spus
- de asemenea
- Tren
- dresat
- Pregătire
- tratate
- ÎNTORCĂ
- care stau la baza
- utilizare
- utilizat
- folosind
- de
- viziune
- vizual
- modalități de
- we
- săptămână
- au fost
- Ce
- cand
- care
- voi
- Win-Win
- cu
- cuvinte
- mai rău
- ar
- scris
- tu
- Ta
- zephyrnet