Күрделі ортада адамдар AI-ға қарағанда сөйлеудің мағынасын жақсы түсінеді, өйткені біз құлағымызды ғана емес, көзімізді де пайдаланамыз.
Мысалы, біз біреудің аузының қозғалғанын көреміз және біз естіген дыбыс сол адамнан шыққан болуы керек екенін интуитивті түрде білуіміз мүмкін.
Meta AI жаңа AI диалогтық жүйесінде жұмыс істейді, ол AI-ға әңгімелесуде көргені мен еститін нәрселер арасындағы нәзік корреляцияны тануды үйренуге үйретеді.
VisualVoice таңбаланбаған бейнелерден көрнекі және есту сигналдарын үйрену арқылы дыбыстық-бейнелік сөйлеуді ажыратуға мүмкіндік беретін адамдардың жаңа дағдыларды меңгеруді үйренуіне ұқсас жолмен үйренеді.
Машиналар үшін бұл жақсы қабылдауды жасайды, ал адамның қабылдауы жақсарады.
Әлемнің түкпір-түкпірінен келген әріптестермен метаверстегі топтық кездесулерге қатыса алатыныңызды елестетіп көріңіз, виртуалды кеңістікте қозғалған кезде кішігірім топтық жиналыстарға қосылыңыз, бұл кезде сахнадағы дыбыс ревербтері мен тембрлері қоршаған ортаға сәйкес реттеледі.
Яғни, ол аудио, бейне және мәтіндік ақпаратты бір уақытта ала алады және пайдаланушыларға «өте керемет» дыбыс тәжірибесін алуға мүмкіндік беретін қоршаған ортаны түсіну моделіне ие.
Жіберу уақыты: 20.07.2022 ж