Teknolohiya ng Pagkilala sa Boses: Nakatutulong o Nakakasakit?

May -Akda: Judy Howell
Petsa Ng Paglikha: 28 Hulyo 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
SCP-4730 Earth, Crucified class class keter | extradimensional scp
Video.: SCP-4730 Earth, Crucified class class keter | extradimensional scp

Nilalaman


Takeaway:

Ang pakikipag-ugnay sa mga electronics sa pag-uusap ay nagiging pangkaraniwan - at kinakailangan. Ngunit sa ngayon, ang mga resulta ay nagpasya na halo-halong.

Nakatawag ka na ba ng isang kumpanya upang makakuha ng tulong o magbayad ng iyong bayarin, lamang na batiin ng isang maayang naitala na boses na nais na magkaroon ng isang pag-uusap sa iyo - ngunit hindi mo maintindihan ang kalahati ng sinasabi mo? O marahil ay nagmamay-ari ka ng isang iPhone, at habang si Siri ay unang tila tulad ng isang mabuting kaalyado, nalaman mo na minsan (OK, pinapayagan kang matapat, madalas) hindi niya ito nakuha? Ang teknolohiyang pagkilala sa boses (VRT), na kilala rin bilang speech-to-, ay nahuhulog sa isang karaniwang bitag: ito ay may potensyal na maging hindi mapaniniwalaan o kapani-paniwala na cool (at batang lalaki, pinag-uusapan natin ito), ngunit mas madalas, ito ay isang ehersisyo na paggiling ng ngipin. sa pagkabigo.

Kapag ang isang ideya na kabilang sa larangan ng science fiction, ang pagkilala sa boses ay lumago mula pa noong kanyang pagkabata noong 1950s, nang ang sistema ng Bell Laboratories Audrey ay dinisenyo upang makilala ang mga digit na sinasalita sa isang solong tinig, sa modernong network ng mga pakikipag-usap sa elektronik na nakikipag-ugnay na tayo ngayon sa pang-araw-araw na batayan - na may halo-halong mga resulta.

Upang Magsalita sa isang Tao, Mangyaring Pindutin ang 0

Marami sa mga negosyo ngayon ang gumagamit ng mga system na tinatawag na interactive voice response (IVR) upang mahawakan ang mga tawag sa serbisyo sa customer. Ang pinaka-karaniwang paggamit ay para sa mga naka-navigate na mga menu, ngunit ang ilang mga kumpanya ay gumagamit ng mga sistema ng IVR na maaaring ma-access ang impormasyon ng account sa customer at sagutin ang mga menor de edad na katanungan. Karaniwan ang isang software ng Menu IVR ay may isang limitadong bokabularyo, na maaaring limitahan sa "oo," "hindi" at mga numero. Ang mas kumplikadong mga system ay maaaring makilala ang mga salita at parirala na tiyak sa kumpanya.

Ang mga sistemang ito ay nagiging mas tanyag - hindi bababa sa mga negosyo - para sa isang simpleng kadahilanan: ang mga ito ay mabisa sa gastos. Ayon sa isang ulat sa 2010 ng Wall Street Journal, isang tipikal na tawag sa customer na umaabot sa isang ahente ng gastos sa pagitan ng $ 3 at $ 9, habang ang isang tawag na hawakan sa pamamagitan ng isang awtomatikong sistema ay nagkakahalaga lamang ng lima hanggang pitong sentimos. At, siyempre, ang mga programa sa computer ay hindi napapagod, tumawag sa sakit, o maging bigo sa mga customer (bagaman tiyak na nabigo ang mga customer sa kanila!).

Sa kabutihang palad, hindi nangangahulugang nangangahulugan ito na ang IVR ay tumatagal ng mga trabaho sa mga tao - o hindi bababa sa lahat ng tao ay nawawala mula sa mga call center. Pinapayagan ng mga katulong na ito na tinulungan ng boses ang mga serbisyo ng customer ng tao na maging mas produktibo sa pamamagitan ng pagturo ng mga tawag at pagsagot sa mga simpleng katanungan.

Siyempre para sa mga gumagamit ng tao na nakikipag-ugnay sa mga teknolohiyang ito, hindi palaging maayos na paglalayag. Tumutulong ang teknolohiya upang mapagbuti ang mga karaniwang problema sa teknolohiya ng IVR, tulad ng problema sa mga accent, ngunit ang pagbubutas ng mga awtomatikong sistema ay isang pangkaraniwang tema online. Suriin ang komedya ng skedyul na ito tungkol sa isang elevator na nilagyan ng pagkilala sa boses, na nagtatampok ng pagkabigo na maaaring magawa ng mga pagkakamali sa mga sistema ng IVR.

Mga Application ng Personal na Telepono: Siri, Google Ngayon

Karamihan sa mga tao ay pamilyar sa pagkilala sa boses para sa mga smartphone. Habang ang karamihan sa mga pinakabagong mga modelo ng telepono ay may VR, ang kanilang pagiging popular - at katakut-takot - na-swak nang ipinakilala ng Apple si Siri, ang banayad na mapang-uyam, boses-aktibo na "personal na katulong" para sa iPhone 4S noong 2011. Sa lalong madaling panahon nilikha ng Google ang isang direktang katunggali: Google Ngayon para sa Android Jelly Bean OS. Ang parehong mga sistema ay nagtatampok ng mga tinig ng kababaihan at sopistikadong mga tampok ng pagkilala na nagpapahintulot sa mga gumagamit na "makipag-usap" sa kanilang mga telepono gamit ang kaswal na wika.

Ngunit habang ang mga sistemang ito ay higit na mas sopistikado at pagganap kaysa sa kanilang mga nauna, ipinakikita rin nila na ang teknolohiya ay mayroon pa ring mahabang paraan. Ang mga biro tungkol sa pagkabigo ni Siris ay naging isang tanyag na meme sa Internet. Isang lalaki pa ang nagsampa sa Apple para sa maling advertising patungkol sa mga kakayahan ng Siris.

Marahil na kung bakit habang nilikha ng Apple si Siri upang maging advanced at nagbibigay-kaalaman, ang VR software ay kaunti rin sa gilid ng sassy. Halimbawa, kung nagsasalita ka ng isa sa mga pinaka-kahihiyan na mga linya ng teknolohiya ng katalinuhan sa kasaysayan ng sinehan mula sa 1968 na pelikula "2001: Isang Space Odyssey" - "buksan ang mga pintuan ng pod bay" - Si Siri ay sasagot sa alinman sa linya ng pagsagot mula sa pelikula, " Ikinalulungkot ko (ang iyong pangalan), hindi ako natatakot na gawin iyon, "o ang mas naiinis," kami ng mga ahente ng intelihensiya ay hindi kailanman mabubuhay iyon, tila. "

Ang pagtawag sa iyo ng pangalan ay isa lamang sa mga pag-andar na sumusubok na gawing mas madali ang pagmamahal kay Siri, at kaunti pa sa tao. Ang katulong sa VR ay maaaring sundin ang mga utos ng boses upang tumawag, kumuha ng pagdidikta at s, magsagawa ng mga paghahanap sa Internet para sa impormasyon, maghanap ng mga kalapit na tindahan, magbigay ng mga direksyon sa pagmamaneho at higit pa, lahat nang walang pangangailangan na hawakan ang anupaman. Ang mga sagot ay sabay-sabay na sinasalita ng telepono at ipinapakita sa screen.

Ang Google Now, ang bahagi ng VR ng platform ng Android Jelly Bean, ay halos kapareho sa Siri. Nag-aalok ang system ng parehong malawak na mga kakayahan sa pagkilala sa pamamagitan ng pagsasalin ng kaswal na pagsasalita sa mga utos na nagpapahintulot sa mga gumagamit na tumawag, s, magpapatakbo ng mga paghahanap, magsagawa ng mga kalkulasyon at conversion, grab ang mga kahulugan ng salita, magtakda ng mga alarma, maglaro ng mga kanta, at makakuha ng mga mapa at direksyon.

Sa mga personal na katulong sa boses tulad ng Siri at Google Now, ang mga benepisyo ay halata. Ang lahat mula sa pagtawag at pagpunta sa paghahanap at libangan ay mas mabilis at madali. Sabihin lamang kung ano ang gusto mo, at (halos lahat ng oras) ay kinuha ito ng VR app para sa iyo. Ang hands-off na teknolohiya ng VR ay lalong kapaki-pakinabang habang nagmamaneho. At habang maraming mga tao ang nag-decoke ng Siris flaws, at ang mga manunulat ay nagtalo na ang kakayahan ng Google Nows na mahalagang patakbuhin ang mga gumagamit ay nabubuhay ay kapwa nakakatakot ng isang pang-iinsulto, karamihan sa mga tao ay nakakaramdam ng mga futuristic na teknolohiya na ito ay medyo cool.

Siyempre, ang mga personal na application ng telepono tulad ng Siri at Google Now ay malayo sa perpekto - bagaman ipinapakita nila kung saan maaaring mapamumunuan ang teknolohiyang ito sa hinaharap. Nangangahulugan ito na kahit na si Siri ay isang maling sagot, malamang na matawa at magpatawad sa kanya, alam na ang susunod na bersyon ay magiging mas mahusay.

Kung saan ang VR Falls Flat

Kung nakatagpo ka ng isang IVR nang tumawag ka ng isang negosyo, maaaring napansin mo ang ilang mga hadlang sa komunikasyon. Ang ilang mga programa ay gumagamit ng isang robotic-sa-pagsasalita ng tinig na hindi sinasadya ang mga salita at ginagawang mahirap maunawaan ang mga bagay. Ang iba ay may mga problema sa sensitivity na nagreresulta sa pagiging hindi ma-proseso ang software kung ano ang sinasabi mo kung masyadong malakas, masyadong malambot, o hindi mainsulto nang mabuti.

Bilang karagdagan, maraming mga tao pa rin ang hindi komportable na nakikipag-usap sa isang makina. Kung nagpapatakbo ka ng ilang mga paghahanap sa IVR, maraming nakatagpo ang mga listahan ng mga tao na pinagsama ang mga paraan upang makaligtaan ang mga sistema ng IVR at makapunta sa isang "tunay na tao." Ang mga solusyon na ito ay mula sa "panatilihin ang pagpindot sa 0 para sa isang operator" na "manumpa sa makina hanggang sa makuha nito ang isang tao." Bilang isang resulta, ang karamihan sa mga kamakailan-lamang na pag-unlad sa mga sistema ng IVR ay umiikot sa paggawa ng mga ito nang higit na nakalulugod para sa mga tao; na ginagawang mas matulungin at hindi gaanong robotic ang mga tinig, na ginagawang mas madaling mag-navigate ang system, at ipaalam sa mga tumatawag na kung gaano katagal kukuha ang buong bagay mula sa simula hanggang sa katapusan. Iyon ay nagmumungkahi na ang mas mahusay na teknolohiya ay kalahati lamang ng labanan dito; ang iba pang kalahati ay nakakakuha ng mga gumagamit na nakasakay sa pakikipag-usap sa isang makina.

Ang hawak ng kapalaran

Sa kabila ng mga hamong ito, ang teknolohiya ng pagkilala sa boses ay nagpapabuti sa lahat ng oras. Ang mga aplikasyon tulad ng Siri at Google Now - mga bahid at lahat - ay pa rin labis na kahanga-hanga sa kanilang pagganap, at maraming mga kumpanya ang nagpapalawak ng mga kakayahan ng VR sa iba pang mga aplikasyon.

Halimbawa, si Nuance, ang mga tagalikha ng Dragon NaturallySpeaking speech-to- software, ay nakabuo na ng mga kontrol sa boses para sa mga telebisyon at sasakyan, at ang mga bersyon ng teknolohiyang ito ay isinama sa ilang mga Samsung TV at ang mga sistema ng entertainment sa SYNC na ginamit sa ilang mga sasakyan ng Ford.

At habang ang Google at Apple ay patuloy na nakakahanap ng mga bagong gamit para sa kanilang mga teknolohiya sa pagkilala sa boses, malamang na lalong tumatalakay sa pakikipag-usap sa lahat ng uri ng mga pang-araw-araw na makina, mula sa aming telebisyon hanggang sa aming mga toasters. At, sa sandaling muli, mukhang tama ang fiction ng science. Dapat lang umasa na ang mga matalinong manunulat ay mali tungkol sa isang bagay. Kung ang mga makina na ito ay kumukuha, maaari kang maging maraming problema sa susunod na hihilingin mo kay Siri na "buksan ang mga pintuan ng pod bay."