Äänentunnistustekniikka: hyödyllinen vai tuskallinen?

Kirjoittaja: Judy Howell
Luomispäivä: 28 Heinäkuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Äänentunnistustekniikka: hyödyllinen vai tuskallinen? - Tekniikka
Äänentunnistustekniikka: hyödyllinen vai tuskallinen? - Tekniikka

Sisältö


Ottaa mukaan:

Vuorovaikutus keskusteluselektroniikan kanssa on yhä yleisempiä - ja välttämättömiä. Mutta toistaiseksi tulokset ovat ehdottomasti erilaisia.

Oletko koskaan soittanut yritykseen saadaksesi apua tai maksaaksesi laskusi, vain kun sinua tervehtii miellyttävä äänitetty ääni, joka haluaa keskustella kanssasi - mutta et ymmärrä puolta mitä sanot? Tai ehkä omistat iPhonen, ja vaikka Siri näytti ensin hyvältä liittolaiselta, olet huomannut, että joskus (OK, olkaamme rehellinen, usein) hän vain ei saa sitä? Äänentunnistustekniikka (VRT), joka tunnetaan myös nimellä puhe puheeksi, kuuluu yhteiseen ansaan: sillä on potentiaalia olla uskomattoman viileä (ja poika, me juurtumme siihen), mutta useammin se on hampaiden hiomaharjoitus. turhautuneena.

Aikaisemmin tieteiskirjallisuuden piiriin kuuluva idea, äänentunnistus on kasvanut jo lapsenkengistään saakka 1950-luvulla, jolloin Bell Laboratories Audrey -järjestelmä suunniteltiin tunnistamaan yhdellä äänellä puhutut numerot nykyaikaiseen keskusteluelektroniikan verkkoon, jonka kanssa olemme nyt vuorovaikutuksessa. päivittäin - vaihtelevilla tuloksilla.

Jos haluat puhua ihmisen kanssa, paina 0

Monet nykypäivän yritykset käyttävät nyt interaktiivisen puhevastauksen (IVR) järjestelmiä asiakaspalvelupuhelujen käsittelemiseen. Yleisin käyttö on ääni-navigoiduissa valikoissa, mutta jotkut yritykset käyttävät IVR-järjestelmiä, jotka pääsevät asiakastilitietoihin ja vastaavat pieniin kysymyksiin. Valikko IVR-ohjelmistolla on yleensä rajoitettu sanasto, joka voi olla rajoitettu "kyllä", "ei" ja numeroihin. Monimutkaisemmat järjestelmät tunnistavat yrityskohtaiset sanat ja ilmaukset.

Näistä järjestelmistä tulee yhä suositumpia - ainakin yrityksille - yksinkertaisesta syystä: ne ovat kustannustehokkaita. Wall Street Journalin vuoden 2010 raportin mukaan tyypillinen edustajaan päästävä asiakaspuhelu maksaa 3–9 dollaria, kun taas automaattisen järjestelmän kautta hoidettu puhelu maksaa vain viisi – seitsemän senttiä. Ja tietysti, tietokoneohjelmat eivät väsy, ota sairaiksi tai turhaudu asiakkaiden suhteen (vaikka asiakkaat turhautuvat varmasti heidän kanssaan!).

Onneksi tämä ei tarkoita aina, että IVR vie työpaikat ihmisiltä - tai ainakin sen, että kaikki ihmiset ovat katoamassa puhelinkeskuksista. Nämä ääniohjatut avustajat antavat ihmisille tarkoitetun asiakaspalvelun edustajien olevan tuottavampia ohjaamalla puheluita ja vastaamalla yksinkertaisiin kysymyksiin.

Tietenkin ihmisille, jotka ovat vuorovaikutuksessa näiden tekniikoiden kanssa, sen purjehdus ei aina ole sujuvaa. Teknologia auttaa parantamaan IVR-tekniikan yleisiä ongelmia, kuten aksenttivaikeuksia, mutta automatisoitujen järjestelmien säkkien poisto on edelleen yleinen teema verkossa. Tutustu tähän komediaan hissillä, joka on varustettu äänentunnistuksella, mikä korostaa turhautumista, jota IVR-järjestelmien toimintahäiriöt voivat aiheuttaa.

Henkilökohtaiset puhelinsovellukset: Siri, Google Now

Suurin osa ihmisistä tuntee älypuhelimien äänentunnistuksen. Vaikka suurin osa uusimmista puhelinmalleista tulee VR: stä, niiden suosio - ja tunnettavuus - paisutettiin, kun Apple esitteli Siri, iPhone 4S: n lievästi sarkastisen, äänen aktivoiman "henkilökohtaisen avustajan" vuonna 2011. Google loi pian suoran kilpailijan: Google Nyt Android Jelly Bean -käyttöjärjestelmälle. Molemmissa järjestelmissä on naisten ääniä ja hienostuneita tunnistusominaisuuksia, joiden avulla käyttäjät voivat "puhua" puhelimiinsa rento kielen avulla.

Mutta vaikka nämä järjestelmät ovat huomattavasti kehittyneempiä ja toiminnallisempia kuin edeltäjänsä, ne osoittavat myös, että tekniikalla on vielä pitkä tie kuljettavanaan. Vitseistä Sirisin epäonnistumisesta on tullut suosittu Internet-meemi. Yksi mies jopa haastoi Appleia väärin mainostamiseen Sirisin ominaisuuksien suhteen.

Ehkä juuri siksi, vaikka Apple loi Sirin edistyneeksi ja informatiiviseksi, VR-ohjelmisto on myös hiukan surkea. Esimerkiksi, jos puhut yhtä elokuvan historian pahamaineisimmista älytekniikan linjoista elokuvasta 1968 "2001: A Space Odyssey" - "avaa pod-lahden ovet" - Siri vastaa joko elokuvan vastauslinjalla ". Olen pahoillani (nimesi). Pelkään, etten voi tehdä sitä "tai tarkemmin sanottuna," tiedustelupalvelijat eivät koskaan elä niin alas, ilmeisesti. "

Nimelle soittaminen on vain yksi toiminnoista, jotka yrittävät tehdä Siristä rakastamisen helpommaksi ja hiukan inhimillisemmäksi. VR-avustaja voi seurata äänikomentoja soittaaksesi, sanelua ja sanoja, suorittaaksesi tiedonhakuja Internetissä, löytääksesi lähikauppoja, antaa ajo-ohjeita ja muuta, kaikki ilman, että sinun tarvitsee koskea mihinkään. Puhelin puhuu vastaukset samanaikaisesti ja ne näkyvät näytöllä.

Google Now, Android Jelly Bean -alustan VR-osa, on hyvin samanlainen kuin Siri. Järjestelmä tarjoaa samat laajat tunnistusominaisuudet kääntämällä satunnaisen puheen komennoiksi, joiden avulla käyttäjät voivat soittaa, s, suorittaa hakuja, suorittaa laskelmia ja muunnoksia, tarttua sanamäärityksiin, asettaa hälytyksiä, toistaa kappaleita ja saada karttoja ja ohjeita.

Henkilökohtaisten äänesavustajien, kuten Siri ja Google Now, eduista on selvää. Kaikki soittamisesta ja soittamisesta etsimiseen ja viihteeseen on nopeampaa ja helpompaa. Sano vain haluamasi, ja (suurimman osan ajasta) VR-sovellus tarttuu siihen sinulle. VR: n hands-off-tekniikka on erityisen hyödyllinen ajon aikana. Ja vaikka monet ihmiset ovat päättäneet Sirisin virheistä, ja kirjoittajat ovat väittäneet, että Google Nowsin kyky pääasiassa ajaa käyttäjien elämää on molemmat pelottavaa vähän loukkaavaa, useimpien mielestä nämä futuristiset tekniikat ovat aika hienoja.

Tietenkin henkilökohtaiset puhelinsovellukset, kuten Siri ja Google Now, eivät ole kaukana täydellisyydestä - vaikka ne osoittavatkin, mihin tämä tekniikka voisi tulevaisuudessa suuntautua. Tämä tarkoittaa, että vaikka Siri osoittaisi väärän vastauksen, ne todennäköisesti nauraisivat ja antaisivat anteeksi hänelle tietäen, että seuraava versio on paljon parempi.

Missä VR putoaa tasaiselle

Jos olet koskaan kohdannut IVR: n, kun olet kutsunut yritystä, olet ehkä huomannut tietyt viestinnän esteet. Jotkut ohjelmat käyttävät robotti puheeksi -ääntä, joka kieltää sanat väärin ja vaikeuttaa asioiden ymmärtämistä. Toisilla on herkkyysongelmia, jotka johtavat siihen, että ohjelmisto ei kykene käsittelemään sanomaasi, jos olet liian äänekäs, liian pehmeä tai älykäs huolella.

Lisäksi monet ihmiset eivät vain vain tuntea olonsa mukavaksi puhuaksesi koneen kanssa. Jos suoritat muutaman haun IVR: llä, kohtaat luettelot, joissa ihmiset ovat koottaneet tapoja ohittaa IVR-järjestelmät ja päästä "oikean ihmisen" puoleen. Nämä ratkaisut vaihtelevat "pitäkää painettaessa 0 operaattoriin" "vannomaan koneeseen, kunnes se vie ihmisen". Seurauksena on, että suuri osa viimeaikaisesta kehityksestä IVR-järjestelmissä on tehty niiden tekemisestä ihmisille miellyttävämmäksi; Äänten tekeminen sympaattisemmiksi ja vähemmän robottisiksi, helpottaen järjestelmän navigointia ja antamalla soittajille tietää, kuinka kauan koko asia kestää alusta loppuun. Tämä viittaa siihen, että parempi tekniikka on vain puoli taistelua täällä; toinen puoli saa käyttäjät käyttämään aluetta puhumaan koneelle.

Mitä tulevaisuus tuo tullessaan

Näistä haasteista huolimatta äänentunnistustekniikka paranee koko ajan. Sovellukset, kuten Siri ja Google Now, - puutteet ja kaikki - ovat edelleen poikkeuksellisen vaikuttavia suorituskyvyllään, ja useat yritykset laajentavat VR-ominaisuuksia muihin sovelluksiin.

Esimerkiksi Dragon NaturallySpeaking -puheohjelmistojen luoja Nuance on jo kehittänyt televisioiden ja autojen ääniohjaukset, ja tämän tekniikan versiot on sisällytetty joihinkin Samsung-televisioihin ja SYNC-viihdejärjestelmiin, joita käytetään tietyissä Ford-ajoneuvoissa.

Ja kun Google ja Apple löytävät edelleen uusia tapoja äänentunnistustekniikoilleen, on todennäköistä, että puhutaan yhä enemmän kaikenlaisiin päivittäisiin koneisiin televisioista aina leivänpaahtimiin. Ja jälleen kerran näyttää siltä, ​​että tieteiskirjallisuus oli oikeassa. No on vain toivoa, että nuovat kirjailijat ovat väärässä yhdestä asiasta. Jos nämä koneet ottavat haltuunsa, saatat olla suurissa vaikeuksissa seuraavan kerran, kun pyydät Siriä "avaamaan pod-lahden ovet".