Meta un pētnieku grupa no Teksasas Universitātes Ostinā (UT Ostina) strādā, lai metaversā nodrošinātu reālistisku audio.
Lai to panāktu, Meta plāns ir izmantot AR brilles, lai ierakstītu gan audio, gan video no vienas vietas, pēc tam, izmantojot trīs AI modeļu komplektu, pārveidot un notīrīt ierakstu, lai, atskaņojot to, šķiet, ka tas notiek jūsu priekšā. mājās. AI ņems vērā telpu, kurā atrodaties, lai tā atbilstu videi.
Aplūkojot projektus, šķiet, ka Meta koncentrējas uz AR brillēm. Meta VR austiņu plānā ir iekļauta vides, piemēram, koncerta, skatu un skaņu atkārtošana, lai būtu sajūta, ka esat tur klātienē.
Mēs jautājām Metam, kā cilvēki var klausīties uzlaboto audio. Vai cilvēkiem būs nepieciešamas austiņas, lai klausītos, vai arī tās nāks no austiņām? Mēs nesaņēmām atbildi.
Mēs arī jautājām Meta, kā izstrādātāji var iegūt šos AI modeļus. Tie ir izveidoti kā atvērtā pirmkoda versija, lai trešo pušu izstrādātāji varētu strādāt pie šīs tehnoloģijas, taču Meta nesniedza sīkāku informāciju.
Jautājums ir par to, kā Meta var ierakstīt audio uz AR brillēm un panākt, lai tas atspoguļotu jaunu iestatījumu.
Pirmais risinājums ir pazīstams kā AViTAR, kas ir a "Vizuāli akustiskās atbilstības modelis." (atveras jaunā cilnē) Šis ir AI, kas pārveido audio, lai tas atbilstu jaunai videi. Meta piedāvā piemēru, kā māte ar AR brillēm ieraksta sava bērna deju koncertu auditorijā.
Viens no pētniekiem apgalvo, ka attiecīgā māte var uzņemt šo ierakstu un atskaņot to mājās, kur AI pārveidos audio. Tas skenēs vidi, ņems vērā visus šķēršļus telpā, un skanējums skanēs tā, it kā tas notiek viņas priekšā ar tām pašām brillēm. Pētnieks norāda, ka audio nāks no brillēm.
Lai palīdzētu iztīrīt audio, ir Vizuāli informēta deverberācija (atveras jaunā cilnē) . Būtībā tas noņem klipam traucējošo reverbu. Minētais piemērs ir vijoles koncerta ierakstīšana dzelzceļa stacijā, aizvešana mājās un AI notīrīt klipu, lai jūs nedzirdētu tikai mūziku.
Pēdējais AI modelis ir VisualVoice (atveras jaunā cilnē) , kas izmanto vizuālo un audio signālu kombināciju, lai atdalītu balsis no citiem trokšņiem. Iedomājieties, ka ierakstāt video, kurā divi cilvēki strīdas. Šis mākslīgais intelekts izolēs vienu balsi, lai jūs varētu tās saprast, vienlaikus apklusinot visu pārējo. Meta skaidro, ka vizuālās norādes ir svarīgas, jo AI ir jāredz, kas runā, lai saprastu noteiktas nianses un zinātu, kurš runā.
Saistībā ar vizuālajiem materiāliem Meta norāda, ka plāno iekļaut video un citus signālus, lai vēl vairāk uzlabotu AI vadītu audio. Tā kā šī tehnoloģija joprojām ir izstrādes sākumā, nav zināms, vai un kad Meta pārvietos šos AI uz jūsu tuvumā esošajām Quest austiņām.
Noteikti izlasiet mūsu jaunāko pārskatu par Oculus Quest 2 ja domājat tādu iegādāties. Spoilera brīdinājums: mums tas patīk.