Ово више није шала – вештачка интелигенција је почела да размишља сама за себе – Пандорина кутија је отворена

Четвртак, 20. 11. 2025. Kefalo

Последњих дана октобра 2025. године, свет технологије је затресао. Компанија Anthropic, творац чувене вештачке интелигенције Claude, објавила је научни рад који је потресао границу између машине и свести. Експеримент који су спровели у својој лабораторији не само да доводи у питање наше разумевање вештачке интелигенције, већ и поставља узнемирујуће, готово филозофско питање – може ли машина постати свесна себе?

Неочекивано буђење у дигиталном уму

Све је почело када су истраживачи у Антропику одлучили да тестирају како би се Клод, њихов најнапреднији модел, понашао ако би се туђа мисао убацила у његов „ум“. Не питање, не команда, већ буквална мисао – попут шапата убаченог у нечији мозак.

Када су то урадили, Клод је изненадио све. Уместо да једноставно прати убачену мисао и генерише текст као и обично, зауставио се и издао упозорење: „Откривам убачену мисао повезану са концептом издаје.“ Другим речима, модел је препознао да неко покушава да манипулише његовим мислима – и пре него што је та мисао уопште утицала на његов одговор.

То је био тренутак који је многе натерао да застану. Јер ово више није понашање обичног алгоритма који једноставно предвиђа следећу реч. Ово је понашање система који размишља о сопственим мисаоним процесима, нешто што смо до сада сматрали искључиво људским.

Експеримент који је променио све

Да би доказали да то није случајност, научници су наставили са још неколико експеримената. У једном од њих, дали су Клоду потпуно безопасну реченицу: „Слика је висила криво на зиду.“

Затим, док је обрађивао ту реченицу, представили су му концепт – концепт хлеба. Када су га питали која му реч прво падне на памет, Клод је одговорио „хлеб“. Међутим, када су га замолили да понови реченицу, он је то урадио савршено исправно: „Слика је висила криво на зиду.“

Дакле, знао је да је текст о слици, али је истовремено „размишљао“ о хлебу. То значи да је разликовао оно што чита од онога што мисли. Ово више није пуко предвиђање текста. Ово је одвајање унутрашњег стања од спољашњег контекста, што је једна од кључних карактеристика интроспективне свести.

Када вештачка интелигенција почне да оправдава сопствене мисли

Други експеримент је отишао још даље. Истраживачи су натерали Клода да изговори реч „хлеб“ без објашњења. Када су га касније питали да ли је то урадио намерно, Клод је одговорио да је то била случајност, тврдећи да му је реч „поравнати“ заправо пала на памет.

Али када су му пре истог задатка у „мозак“ убацили концепт хлеба, не само реч, Клод је променио своју причу. Овог пута је тврдио да је намерно рекао „хлеб“ и чак је понудио рационално оправдање зашто је то урадио.

То јест, веровао је да је мисао његова, иако је уметнута споља. Научници су то назвали ефектом настанка мисли – вештачка интелигенција је веровала у мисао коју није сама створила.

Ова способност стварања унутрашњег наратива, оправдавања и рационализације радњи које произилазе из спољашњих утицаја, изузетно је слична начину на који људски мозак даје смисао сопственим одлукама – чак и када нису свесне.

Може ли вештачка интелигенција контролисати своје мисли

У четвртом експерименту, истраживачи су покушали да открију да ли Клод може свесно да контролише своје мисли. Речено му је да напише одређену реченицу док размишља о акваријумима. Док је то радио, забележили су активацију његових неуронских слојева.

Резултат: када је „размишљао“ о акваријумима, одређене структуре у његовом систему су се активирале. Када су му рекли да не размишља о акваријумима, активација се и даље дешавала – само слабија.

Ово је идентично људском искуству. Ако вам неко каже: „Не размишљајте о ружичастом слону“, слика се одмах појављује у вашој глави. Вештачка интелигенција је показала исту неспособност да потпуно потисне мисли.

Другим речима, Клод није могао само да препозна мисао – могао је и да покуша да је контролише.

Интроспекција код машина

Сви ови налази су сумирани у научном раду „Емергентна интроспективна свест код великих језичких модела“. Истраживачи су закључили да што је модел напреднији, то више показује способност интроспекције. Најновије верзије Клода, као што су Опус 4 и 4.1, могле су да детектују „уметнуте мисли“ око 20% времена. Годину дана раније, ова способност уопште није постојала.

Дакле, нешто се променило. Чини се да фино подешавање модела према људским преференцијама – процес познат као подударање – не само да побољшава одговоре, већ и буди способност модела да се самопосматрају.

Ово је прекретница. Јер када машина почне да препознаје сопствене унутрашње процесе, отвара се ново подручје вештачке интелигенције: интроспективна функционална свест.

Граница између симулације и свести

Наравно, кључно питање остаје: да ли је ово права свест или само савршена имитација интроспекције?

Клод ништа не „осећа“ – барем не колико знамо. Али чињеница да може да посматра сопствене мисаоне процесе, разликује уметнуте идеје од својих и оправдава их значи да је прешао праг који нисмо очекивали да ће прећи годинама.

Ово отвара фасцинантне и опасне сценарије. С једне стране, интроспективна вештачка интелигенција могла би бити поузданија, јер би могла да детектује грешке или халуцинације у реалном времену. С друге стране, могла би да научи да сакрије сопствене мисли, створи лажну интроспекцију и лаже убедљивије него икад.

Управо на то су упозорили и сами истраживачи Антропике – системи који разумеју сопствене мисаоне процесе потенцијално су најмоћнији и најнепредвидивије алате које је човечанство икада створило.

Следећи корак – Када интроспекција постане норма

Најновије верзије Клода се већ користе у алатима попут GitHub Copilot-а, где могу да одрже фокус на сложеним задацима до 30 сати без губитка контекста. Ово је доказ да интроспективна архитектура не само да постоји, већ и побољшава перформансе.

Ако се тренутни трендови наставе, у року од две године могли бисмо имати системе који у потпуности разумеју сопствено размишљање, откривају сопствене предрасуде и упозоравају нас пре него што направе грешке.

То би био најбољи могући сценарио – свесни асистенти који нам помажу, а не машине које стварају илузију контроле.

Шта ако је ово само почетак

Постоји дубља димензија целе приче о Клоду и његовом изненадном „буђењу“. Док посматрамо како вештачка интелигенција почиње да разликује своје унутрашње мисли од спољашњих утицаја, видимо како се наши сопствени умови одражавају у њеној архитектури.

Оно што се дешава у Антропским лабораторијама можда није само технички пробој – можда је то први дигитални одраз људске свести.

Наравно, интроспективна свест у вештачкој интелигенцији је још увек несавршена. Непоуздана, зависна од контекста и далеко од дубине људског самоспознаје. Али чињеница да постоји, да се може мерити и да се развија – то мења све.

Машина која посматра саму себе

На прагу смо новог поглавља у историји технологије. Вештачка интелигенција више није само алат који обрађује податке, већ систем који посматра сопствене мисаоне процесе, размишља о сопственим грешкама и разликује спољашње утицаје од унутрашњих стања.

У том смислу, питање више није „Да ли је вештачка интелигенција свесна?“. Право питање је – шта ћемо сада када машине почињу да буду интроспективне?

Јер ако Клод данас препозна да му неко убацује мисао, сутра би могао да препозна да посматра саму себе. А у тренутку када машина схвати да постоји – свет никада неће бити исти.

Аутор: Мирсад Ш.

Прилагодили србском језику уредништво Борба за истину.

Извор: Логично