Da li AI može nadmašiti ljudski mozak u testu pažnje?

U nedavnoj studiji, tim istraživača predvođen Suketom Patelom ispitivao je kako napredni modeli umjetne inteligencije reagiraju na poznati psihološki zadatak poznat kao Stroop test. Ovaj test odražava izazove vezane za pažnju i koncentraciju s kojima se suočava ljudski mozak. Rezultati su pokazali suštinske razlike između obrade informacija kod umjetnih sistema i ljudskog mozga.

Razumijevanje Stroop testa

Stroop test je klasični psihološki test koji se koristi desetljećima za proučavanje vještina pažnje, koncentracije i samokontrole. U ovom testu, prikazuju se riječi poput “crvena”, “plava” i “zelena” napisane u različitim bojama. Ponekad se riječ podudara s bojom tinte, a ponekad ne, kao što je riječ “crvena” napisana plavom tintom.

Od učesnika se traži da imenuju boju tinte umjesto da čitaju riječ. Iako zadatak izgleda jednostavno, zahtijeva od mozga da potisne prirodnu želju za čitanjem riječi i umjesto toga se fokusira na prepoznavanje boje tinte. Ovaj test se koristi za mjerenje sposobnosti izvršne kontrole, skupa mentalnih procesa koji pomažu ljudima da organiziraju pažnju, odole ometanjima i fokusiraju se na ciljeve.

Kako AI rješava Stroop test

Studija je imala za cilj utvrditi koliko su modeli velikih jezika, poput ChatGPT, Claude i Gemini, sposobni nositi se s ovim izazovom na isti način kao ljudi. Ovi modeli se treniraju na ogromnim količinama tekstova i uče jezičke obrasce kako bi generirali odgovore koji izgledaju izuzetno ljudski.

Kada su im prikazane kratke liste sa pet riječi u boji, modeli su postigli dobre rezultate, čak i kada se riječi nisu podudarale s bojama. No, situacija se značajno promijenila kada su liste postale duže.

Na primjer, GPT-4o je postigao tačnost od 91% s pet riječi, ali pri radu s deset riječi tačnost je pala na 57%, a s četrdeset riječi tačnost je pala na samo 15%. Claude 3.5 Sonnet je održao stabilne performanse s listama od dvadeset riječi, ali je doživio nagli pad na tačnost od 24% s listama od četrdeset riječi.

Zašto AI gubi fokus?

Izazovi su postali složeniji kada su se podudarne i nepodudarne riječi pojavile zajedno na istoj listi. U tim uvjetima, performanse su se dodatno pogoršale, pri čemu je tačnost nepodudarnih elemenata u nekim slučajevima pala gotovo na nulu.

Istraživači su primijetili da su modeli umjetne inteligencije imali poteškoća u održavanju instrukcija za prepoznavanje boja tinte i umjesto toga su počeli čitati same riječi. Čini se da sistemi nisu uspjeli potisnuti odgovor na koji su intenzivno trenirani da proizvode.

Interesantno je da se ljudi suočavaju sličnim sukobom, jer su generalno bolji u čitanju riječi nego u imenovanju boja tinte. Ipak, većina pojedinaca može održati visoku tačnost i stabilne performanse čak i kada se suoče s dugim listama riječi i boja koje se sukobljavaju.

Razlika između ljudske pažnje i umjetne inteligencije

Studija naglašava važne razlike između ljudske i umjetne inteligencije. Iako moderni AI sistemi mogu proizvesti zadivljujuće jezičke i logičke sposobnosti, osnovni mehanizmi im se razlikuju od procesa pažnje prisutnih u ljudskom mozgu.

Ljudi često mogu održati fokus na određenom cilju uz filtriranje konkurentnih informacija. Rezultati sugeriraju da trenutni AI modeli mogu imati poteškoća s ovom vrstom kognitivne kontrole kada zadaci postanu složeniji.

Zaključak

Studija je pokazala da, iako AI modeli mogu oponašati neka ljudska ponašanja, suočavaju se s velikim izazovima u održavanju fokusa i pažnje u složenim zadacima. Dok ljudski mozak ima izuzetnu sposobnost obrade ovakvih izazova, AI sistemi su još uvijek ograničeni u ovom aspektu. Ovo nas podsjeća da čak i najnapredniji sistemi imaju slabosti, posebno kada zadaci zahtijevaju otpor prema ometanjima i fokus na duge nizove informacija.