Låt oss använda smartphonemikrofonerna bättre

Jag arbetade på en fil häromdagen när min iPhone dök upp ett meddelande: "Ett ljud har identifierats som kan vara en dörrklocka." En dörrklocka hade precis ringt. 

Detta är en av de nya samlingen av tillgänglighetsmeddelanden för dem som har svårt att höra. Apple har rullat ut många av dessa på sistone, och Googles Android har gjort samma sak

Faktum är att iPhone har en hel del ljud som den är tränad att lyssna på: brandlarm, sirener, brandvarnare, katter och hundar, apparater (även om jagJag är inte klar över exakt vilka apparater), biltutor, dörrklockor, dörrknackningar, glas som går sönder, vattenkokare, vatten som rinner, babygråt, hostande och skrik. Den måste också inaktivera "Hej Siri" röstkommandon om den lyssnar efter andra ljud. Det är inte klart varför det är så; om telefonen redan lyssnar, varför inte bara inkludera kommandot "Hej Siri" i listan över objekt att lyssna efter?

Men tänk om denna ljudigenkänning kunde justeras för att utföra grundläggande IT- och operativa sysslor? Se det som ett alternativ för att anpassa telefonen för att lyssna efter ljud som är specifika för ditt företag. Precis som det klassiska maskininlärningsexemplet kan telefonen höra ett ljud i ett arbetsområde och säga: "Det låter som att XYZ-komponenten i den enorma maskindelen överhettas."

Eller kanske funktionen kan vara något ännu mer användbart, som att upptäcka när en specifik person kommer ner i korridoren. "Varna! Ken från Legal närmar sig. Göm dig nu." Eller kanske du kan placera telefonen vid ett öppet fönster så att den kan lyssna efter ljudet av din chefs bil som anländer?

Det kan också bli ett ondskefullt hanteringsverktyg som varnar någon om inga tangentbordsklick har upptäckts under en förutbestämd tidsperiod. Vad sägs om en användbar identifierare? Om nummerpresentation inte är relevant, kan det programmeras med rösterna från alla användare så att det kan flagga namnet på den som ringer? (En ond version skulle vara att identifiera anställda som ringer till en anonym klagomålslinje.)

Ta detta upp ett snäpp och en smartphone kan anpassas för att identifiera vilka ljud du vill, för att hjälpa verksamheten. Vi vet redan att videokonferenssystem alltid lyssnar — även när du har stängt av mikrofonen - men tänk om telefonen kunde hjälpa till att identifiera vem som faktiskt pratar? Vissa system erbjuder det nu, men det är inte universellt och det fungerar inte ens rutinmässigt med system som påstår sig ha det. 

Har du någonsin stött på en snabbpratare på jobbet? Tänk om telefonen kunde lyssna och röra in din hörsnäcka en långsam och tydligare tolkning? Ja, det kan också visa en realtidsutskrift på skärmen, men det är svårt att titta på den skärmen hela tiden och inte märkas. Hörlursuppmaningar är mer diskreta.

Sedan finns det alltid "röstliggendetektion" i realtid. Föreställ dig att ha en chatt med din handledare och höra, "Det är förmodligen en lögn." Det kan hjälpa under styrelse- eller publikpresentationer genom att lyssna efter en hög volym av suckar eller gäspningar, vilket leder till en varnande uppmaning: "Sluta upp det. Du tappar bort dem." Visst, en bra talare skall vet det, men om talaren är fokuserad på något komplicerat material kanske han eller hon inte uppfattar att publiken blir distraherad.

Eftersom Apple, Google och andra arbetar för att perfekta tillgänglighetsfunktioner som verkligen är användbara och användbara, är det uppenbart att så mycket mer kan göras med dessa enheter.

Upphovsrätt © 2022 IDG Communications, Inc.

Källa