Ilagay natin ang smartphone mics para mas magamit

Nagtatrabaho ako noong isang araw nang mag-pop up ang iPhone ko ng isang mensahe: "Nakilala ang isang tunog na maaaring isang doorbell." Sa totoo lang, isang doorbell ang tumunog. 

Isa ito sa bagong koleksyon ng mga notification sa pagiging naa-access para sa mga may problema sa pandinig. Ang Apple ay inilunsad marami sa mga ito kamakailan, at Google Ganoon din ang ginagawa ng Android

Sa katunayan, ang iPhone ay may kaunting mga tunog na sinanay nitong pakinggan: mga alarma sa sunog, mga sirena, mga alarma sa usok, mga pusa at aso, mga kasangkapan (bagaman akoHindi ako malinaw kung aling mga kasangkapan), mga busina ng kotse, mga doorbell, mga katok sa pinto, mga basag ng salamin, mga takure, agos ng tubig, pag-iyak ng sanggol, pag-ubo at pagsigaw. Kailangan din nitong i-deactivate ang mga voice command na "Hey, Siri" kung nakikinig ito para sa iba pang mga tunog. Hindi malinaw kung bakit ganoon ang kaso; kung nakikinig na ang telepono, bakit hindi na lang isama ang command na “Hey, Siri” sa listahan ng mga item na pakikinggan?

Ngunit paano kung ang sound-recognition na ito ay maaaring i-tweake upang gawin ang mga pangunahing gawain sa IT at pagpapatakbo? Isipin ito bilang isang opsyon upang i-customize ang telepono upang makinig sa mga tunog na partikular sa iyong kumpanya. Tulad ng klasikong halimbawa ng machine learning, makakarinig ba ang telepono ng tunog sa isang lugar ng trabaho at sabihin, "Mukhang nag-o-overheat ang bahagi ng XYZ sa malaking piraso ng makinarya na iyon."

O marahil ang tampok ay maaaring maging isang bagay na mas kapaki-pakinabang, tulad ng pag-detect kapag ang isang partikular na tao ay darating sa bulwagan. “Alerto! Papalapit na si Ken from Legal. Magtago ka na." O baka maaari mong ilagay ang telepono sa isang bukas na bintana para marinig nito ang tunog ng pagdating ng kotse ng iyong amo?

Maaari rin itong maging isang masamang tool sa pamamahala, na nagpapaalerto sa isang tao kung walang natukoy na pag-click sa keyboard para sa isang paunang natukoy na yugto ng panahon. Paano ang tungkol sa isang kapaki-pakinabang na identifier? Kung ang caller-ID ay hindi germane, maaari ba itong i-program gamit ang mga boses ng lahat ng mga user upang ma-flag nito ang pangalan ng tumatawag? (Ang isang masamang bersyon ay ang pagtukoy sa mga empleyado na tumatawag sa isang hindi kilalang linya ng reklamo.)

Gawin itong mabuti at maaaring ma-customize ang isang smartphone para matukoy ang anumang tunog na gusto mo, para makatulong sa negosyo. Alam na natin na ang mga sistema ng videoconferencing ay palaging nakikinig — kahit na na-mute mo ang iyong mikropono - ngunit paano kung makakatulong ang telepono na matukoy kung sino talaga ang nagsasalita? Ang ilang mga sistema ay nag-aalok na ngayon, ngunit ito ay hindi pangkalahatan at ito ay hindi kahit na regular na gumagana sa mga system na sinasabing mayroon nito. 

Nakatagpo na ba kayo ng mabilis na nagsasalita sa trabaho? Paano kung ang telepono ay maaaring makinig at mag-pipe sa iyong earbud ng mabagal at mas malinaw na interpretasyon? Oo, maaari rin itong magpakita ng realtime na transcript sa screen, ngunit mahirap tingnan ang screen na iyon palagi at hindi mapansin. Mas discrete ang mga prompt ng earbud.

Pagkatapos ay palaging may real-time na "voice-lying detection" na mga alerto. Isipin na nakikipag-chat sa iyong superbisor at marinig ang, "Malamang na kasinungalingan iyon." Makakatulong ito sa panahon ng mga presentasyon ng board o audience sa pamamagitan ng pakikinig sa maraming buntong-hininga o hikab na humahantong sa isang babala na prompt: “I-wrap it up. Nawawala mo sila." Totoo, isang mahusay na tagapagsalita dapat alam mo iyan, ngunit kung ang tagapagsalita ay nakatuon sa ilang kumplikadong materyal, maaaring hindi niya mapansin ang madla na nakakagambala.

Habang nagsusumikap ang Apple, Google at iba pa upang gawing perpekto ang mga feature ng pagiging naa-access na talagang kapaki-pakinabang at kapaki-pakinabang, malinaw na marami pang magagawa sa mga device na ito.

Copyright © 2022 IDG Communications, Inc.

pinagmulan