Wykorzystajmy mikrofony w smartfonach

Kiedyś pracowałem nad plikiem, kiedy mój iPhone wyskoczył komunikat: „Rozpoznano dźwięk, który może być dzwonkiem do drzwi”. Rzeczywiście, właśnie zadzwonił dzwonek do drzwi. 

To jedna z nowej kolekcji powiadomień o ułatwieniach dostępu dla osób, które mają problemy ze słyszeniem. Apple jest wdrażany wiele z nich ostatnio, i Google Android robi to samo

W rzeczywistości iPhone ma sporo dźwięków, do których nasłuchiwania jest wyszkolony: alarmy przeciwpożarowe, syreny, czujniki dymu, koty i psy, urządzenia (chociaż jaNie wiem dokładnie, które urządzenia), klaksony samochodowe, dzwonki do drzwi, pukanie do drzwi, tłuczenie szyb, czajniki, płynąca woda, płacz dziecka, kaszel i krzyk. Musi również dezaktywować polecenia głosowe „Hej, Siri”, jeśli nasłuchuje innych dźwięków. Nie jest jasne, dlaczego tak jest; jeśli telefon już nasłuchuje, dlaczego po prostu nie dodać polecenia „Hej, Siri” do listy elementów do nasłuchiwania?

Ale co by było, gdyby to rozpoznawanie dźwięku można było dostosować do podstawowych zadań informatycznych i operacyjnych? Pomyśl o tym jako o opcji dostosowania telefonu do nasłuchiwania dźwięków charakterystycznych dla Twojej firmy. Podobnie jak w klasycznym przykładzie uczenia maszynowego, telefon mógłby usłyszeć dźwięk w miejscu pracy i powiedzieć: „To brzmi, jakby komponent XYZ w tym ogromnym urządzeniu się przegrzewał”.

A może ta funkcja może być jeszcze bardziej użyteczna, na przykład wykrywać, kiedy konkretna osoba idzie korytarzem. "Alarm! Zbliża się Ken z działu prawnego. Ukryj się teraz. A może mógłbyś umieścić telefon przy otwartym oknie, aby nasłuchiwał odgłosu nadjeżdżającego samochodu szefa?

Może również stać się narzędziem do zarządzania złem, ostrzegającym kogoś, jeśli przez określony czas nie zostaną wykryte żadne kliknięcia klawiatury. Co powiesz na pomocny identyfikator? Jeśli identyfikator dzwoniącego nie jest istotny, czy można go zaprogramować głosami wszystkich użytkowników, aby mógł oflagować nazwę dzwoniącego? (Zła wersja to identyfikowanie pracowników, którzy dzwonią na anonimową linię skarg.)

Podnieś to o krok, a smartfon można dostosować, aby identyfikować dowolne dźwięki, aby pomóc firmie. Wiemy już, że systemy wideokonferencyjne zawsze słuchają — nawet po wyciszeniu mikrofonu - ale co by było, gdyby telefon mógł pomóc zidentyfikować, kto faktycznie mówi? Niektóre systemy oferują to teraz, ale nie jest to uniwersalne i nawet nie działa rutynowo z systemami, które twierdzą, że to mają. 

Zdarzyło Ci się spotkać w pracy szybko mówiącego? Co by było, gdyby telefon mógł słuchać i przesyłać do słuchawki powolną i wyraźniejszą interpretację? Tak, może również wyświetlać na ekranie transkrypcję w czasie rzeczywistym, ale trudno jest stale patrzeć na ten ekran i nie zostać zauważonym. Monity w słuchawkach są bardziej dyskretne.

Następnie zawsze dostępne są alerty „wykrywania kłamstw głosowych” w czasie rzeczywistym. Wyobraź sobie, że rozmawiasz ze swoim przełożonym i słyszysz: „To prawdopodobnie kłamstwo”. Może pomóc podczas prezentacji na tablicy lub na widowni, nasłuchując głośnych westchnień lub ziewów, prowadzących do ostrzeżenia: „Zawiń to. Tracisz je. To prawda, dobry mówca powinien Wiedz o tym, ale jeśli mówca koncentruje się na jakimś skomplikowanym materiale, może nie zauważyć rozpraszania się publiczności.

Ponieważ Apple, Google i inni pracują nad doskonałymi funkcjami ułatwień dostępu, które są naprawdę przydatne i pomocne, jasne jest, że za pomocą tych urządzeń można zrobić znacznie więcej.

Prawa autorskie © 2022 IDG Communications, Inc.

Źródło