“Hrane” ih prvo podacima iz vlastitih baza podataka, a onda i podacima s internet. Ali, šta kad ti podaci “presuše”?
Upravo se s takvim problemom pomalo susreću najveće firme koje su razvile i najpoznatije AI alate. Prema nekim procjenama podaci za obuku mogli bi presušiti već u sljedećih nekoliko godina.
Kako piše Volstrit žurnal, neke firme već traže alternativne izvore podataka poput javno dostupnih video transkripata, a čak se i okreću “sintetičkim podacima” koje pravi druga vještačka inteligencija.
Međutim, nije problem u tome što te firme traže alternativne izvore podataka, već što se sve češće koriste pomalo kontroverznim sredstvima za njihovo stvaranje.
Prema izvorima VSŽ, OpenAI je planirao koristiti transkripte javnih videa s Jutjuba za obučavanje svog alata GPT-5. Jesu li ih i upotrebili, za sad nije poznato.
“Sintetički podaci” našli su se u centru opsežne rasprave posljednjih mjeseci, nakon što su istraživači prošle godine otkrili da bi obučavanje AI alata podacima koje je generisao AI, doveli do kolapsa cijelog modela.
Firme poput OpenAI pokušavaju napraviti kvalitetnije “sintetičke podatke”, ali ne otkrivaju šta bi to tačno značilo, prenosi Zimo.
S druge strane, postoji još jedno rješenje – da se fokusiraju na ispravljanje grešaka koje njihove vještačke inteligencije čine i samo pričekaju da se stvore novi podaci. Uostalom, svake se minute na internetu stvaraju novi podaci koje je moguće upotrebiti za poboljšavanje vještačke inteligencije.
Najnovije vijesti Srpskainfo i na Viberu