Meta vēlas, lai virtuālā ainava izklausītos kā īsta dzīve

Meta un pētnieku grupa no Teksasas Universitātes Ostinā (UT Ostina) strādā, lai metaversā nodrošinātu reālistisku audio.

As Meta AI pētniecības direktore Kristena Garumana skaidro (atveras jaunā cilnē), paplašinātā un virtuālā realitāte (attiecīgi AR un VR) ir vairāk nekā tikai vizuālie attēli. Audio ir ļoti svarīga loma, lai pasaule justos dzīva. Garumans saka: "audio veido vide, kurā tas atrodas." Ir dažādi faktori, kas ietekmē skaņas uzvedību, piemēram, telpas ģeometriju, to, kas atrodas minētajā telpā un cik tālu kāds atrodas no avota.

Lai to panāktu, Meta plāns ir izmantot AR brilles, lai ierakstītu gan audio, gan video no vienas vietas, pēc tam, izmantojot trīs AI modeļu komplektu, pārveidot un notīrīt ierakstu, lai, atskaņojot to, šķiet, ka tas notiek jūsu priekšā. mājās. AI ņems vērā telpu, kurā atrodaties, lai tā atbilstu videi.

Aplūkojot projektus, šķiet, ka Meta koncentrējas uz AR brillēm. Meta VR austiņu plānā ir iekļauta vides, piemēram, koncerta, skatu un skaņu atkārtošana, lai būtu sajūta, ka esat tur klātienē.

Mēs jautājām Metam, kā cilvēki var klausīties uzlaboto audio. Vai cilvēkiem būs nepieciešamas austiņas, lai klausītos, vai arī tās nāks no austiņām? Mēs nesaņēmām atbildi.

Mēs arī jautājām Meta, kā izstrādātāji var iegūt šos AI modeļus. Tie ir izveidoti kā atvērtā pirmkoda versija, lai trešo pušu izstrādātāji varētu strādāt pie šīs tehnoloģijas, taču Meta nesniedza sīkāku informāciju.

Pārveidoja AI

Jautājums ir par to, kā Meta var ierakstīt audio uz AR brillēm un panākt, lai tas atspoguļotu jaunu iestatījumu.

Pirmais risinājums ir pazīstams kā AViTAR, kas ir a "Vizuāli akustiskās atbilstības modelis." (atveras jaunā cilnē) Šis ir AI, kas pārveido audio, lai tas atbilstu jaunai videi. Meta piedāvā piemēru, kā māte ar AR brillēm ieraksta sava bērna deju koncertu auditorijā.

Viens no pētniekiem apgalvo, ka attiecīgā māte var uzņemt šo ierakstu un atskaņot to mājās, kur AI pārveidos audio. Tas skenēs vidi, ņems vērā visus šķēršļus telpā, un skanējums skanēs tā, it kā tas notiek viņas priekšā ar tām pašām brillēm. Pētnieks norāda, ka audio nāks no brillēm.

Lai palīdzētu iztīrīt audio, ir Vizuāli informēta deverberācija (atveras jaunā cilnē). Būtībā tas noņem klipam traucējošo reverbu. Minētais piemērs ir vijoles koncerta ierakstīšana dzelzceļa stacijā, aizvešana mājās un AI notīrīt klipu, lai jūs nedzirdētu tikai mūziku.

Pēdējais AI modelis ir VisualVoice (atveras jaunā cilnē), kas izmanto vizuālo un audio signālu kombināciju, lai atdalītu balsis no citiem trokšņiem. Iedomājieties, ka ierakstāt video, kurā divi cilvēki strīdas. Šis mākslīgais intelekts izolēs vienu balsi, lai jūs varētu tās saprast, vienlaikus apklusinot visu pārējo. Meta skaidro, ka vizuālās norādes ir svarīgas, jo AI ir jāredz, kas runā, lai saprastu noteiktas nianses un zinātu, kurš runā.

Saistībā ar vizuālajiem materiāliem Meta norāda, ka plāno iekļaut video un citus signālus, lai vēl vairāk uzlabotu AI vadītu audio. Tā kā šī tehnoloģija joprojām ir izstrādes sākumā, nav zināms, vai un kad Meta pārvietos šos AI uz jūsu tuvumā esošajām Quest austiņām.

Noteikti izlasiet mūsu jaunāko pārskatu par Oculus Quest 2 ja domājat tādu iegādāties. Spoilera brīdinājums: mums tas patīk.

avots

iepriekšējā Post

Meta vēlas, lai virtuālā ainava izklausītos kā īsta dzīve

Obligāta programmatūra 2024. gadā

Populārākās kategorijas

Jaunākās atsauksmes

Samsung Galaxy Z Flip 5 Teaser Video, pirms Galaxy Unpacked Event, parāda jaunu eņģes dizainu, krāsu opcijas

Twitter ierobežo to DM skaitu, ko var nosūtīt nepārbaudīti lietotāji

Mans iecienītākais Android tālrunis spēj paveikt to, ko mans iPhone 14 Pro Max nespēj

ChatGPT Android ierīcēm tiks palaista nākamnedēļ, un jūs varat iepriekš reģistrēties jau tagad

Xiaomi Smart TV 32A, Smart TV 40A, Smart TV 43A ar Google TV, 20W skaļruņi, kas laisti tirgū Indijā: : Cena, specifikācijas

Šis ēdamais akumulators varētu nodrošināt diagnostikas un ilgtspējīgas enerģijas pasauli