Давайце лепш выкарыстоўваць мікрафоны для смартфонаў

Днямі я працаваў над файлам, калі на маім iPhone з'явілася паведамленне: «Быў распазнаны гук, які можа быць званком у дзверы». Сапраўды, толькі што пазванілі ў дзверы. 

Гэта адна з новай калекцыі апавяшчэнняў аб спецыяльных магчымасцях для тых, хто мае праблемы са слыхам. Кампанія Apple разгортваецца шмат такіх у апошні час, і Google Android робіць тое ж самае

Насамрэч, у iPhone ёсць даволі шмат гукаў, якія ён навучыў слухаць: пажарная сігналізацыя, сірэны, дымавыя сігналізацыі, кошкі і сабакі, тэхніка (хаця яМне незразумела, якія менавіта прыборы), аўтамабільныя гудкі, званкі ў дзверы, стук у дзверы, разбіванне шкла, чайнікі, цячэнне вады, дзіцячы плач, кашаль і крык. Ён таксама павінен адключыць галасавыя каманды «Гэй, Siri», калі ён праслухоўвае іншыя гукі. Незразумела, чаму гэта так; калі тэлефон ужо слухае, чаму б проста не ўключыць каманду «Гэй, Siri» у спіс элементаў для праслухоўвання?

Але што, калі гэтае распазнаванне гуку можна было б наладзіць для выканання асноўных ІТ-працэсаў і аперацый? Успрымайце гэта як магчымасць наладзіць тэлефон для праслухоўвання гукаў, характэрных для вашай кампаніі. Як і ў класічным прыкладзе машыннага навучання, ці можа тэлефон пачуць гук у рабочай зоне і сказаць: «Гэта гучыць так, быццам кампанент XYZ у гэтай вялізнай машыне пераграваецца».

Ці, магчыма, функцыя можа быць чымсьці яшчэ больш карысным, напрыклад, выяўляць, калі канкрэтны чалавек ідзе па калідоры. «Папярэджанне! Набліжаецца Кен з юрыдычнага аддзела. Схавайцеся зараз». Ці, магчыма, вы маглі б паставіць тэлефон каля адчыненага акна, каб ён мог слухаць гук машыны вашага начальніка?

Ён таксама можа стаць злым інструментам кіравання, які папярэджвае кагосьці, калі на працягу зададзенага перыяду часу не было выяўлена націсканняў клавіятуры. Як наконт карыснага ідэнтыфікатара? Калі ідэнтыфікатар абанента недарэчны, ці можна яго запраграмаваць з галасамі ўсіх карыстальнікаў, каб ён мог пазначаць імя абанента? (Злым варыянтам было б выяўленне супрацоўнікаў, якія тэлефануюць на ананімную лінію скаргаў.)

Павялічце гэта, і смартфон можна будзе наладзіць, каб ідэнтыфікаваць любыя гукі, якія вы хочаце, каб дапамагчы бізнесу. Мы ўжо ведаем, што сістэмы відэаканферэнцый заўсёды слухаюць - нават калі вы адключылі мікрафон - але што, калі тэлефон можа дапамагчы вызначыць, хто насамрэч размаўляе? Некаторыя сістэмы прапануюць гэта цяпер, але гэта не ўніверсальна і нават звычайна не працуе з сістэмамі, якія сцвярджаюць, што яны ёсць. 

Вы калі-небудзь сутыкаліся з гаваруном на працы? Што, калі б тэлефон мог слухаць і перадаваць у ваш навушнік павольную і больш выразную інтэрпрэтацыю? Так, ён таксама можа адлюстроўваць стэнаграму ў рэальным часе на экране, але цяжка пастаянна глядзець на гэты экран і не быць заўважаным. Падказкі навушнікаў больш дыскрэтныя.

Затым заўсёды ёсць абвесткі ў рэжыме рэальнага часу аб «выяўленні галасавой хлусні». Уявіце сабе, што вы размаўляеце са сваім кіраўніком і чуеце: «Гэта, хутчэй за ўсё, хлусня». Гэта можа дапамагчы падчас выступленняў на дошцы або ў аўдыторыі, калі прыслухацца да гучных уздыхаў або пазяхання, якія прыводзяць да папярэджання: «Завяршайце. Вы іх губляеце». Зразумела, добры прамоўца павінен ведаю, што, але калі дакладчык засяроджаны на нейкім складаным матэрыяле, ён ці яна можа не заўважыць, што аўдыторыя адцягваецца.

Паколькі Apple, Google і іншыя працуюць над удасканаленнем функцый спецыяльных магчымасцей, якія сапраўды карысныя і карысныя, становіцца відавочным, што з дапамогай гэтых прылад можна зрабіць нашмат больш.

Аўтарскае права © 2022 IDG Communications, Inc.

крыніца