차례:
도움을 받거나 청구서를 지불하기 위해 회사에 전화 한 적이 있습니까? 당신과 대화하고 싶어하는 유쾌한 녹음 된 목소리로 인사를 받으려고했는데 말한 내용의 절반을 이해할 수 없습니까? 아니면 당신이 아이폰을 소유하고있을 수도 있고, 시리가 처음으로 좋은 동맹국처럼 보였지만 가끔은 (정직하게 솔직하게 말하면) 그녀가 그것을 얻지 못한다는 것을 깨닫게 되었습니까? 음성-텍스트로도 알려진 음성 인식 기술 (VRT)은 일반적인 함정에 빠집니다. 엄청나게 시원 할 수있는 잠재력이 있으며 (그리고 소년, 우리는 응원하고 있습니다), 더 자주는 치아 분쇄입니다 좌절에 운동.
한때 공상 과학의 영역에 속하는 아이디어였던 벨 연구소 (Bell Laboratories) 오드리 (Audrey) 시스템이 현재 우리가 상호 작용하는 현대의 전자 통신 네트워크에 이르기까지 한 목소리로 말한 숫자를 인식하도록 설계된 1950 년대 초반부터 음성 인식이 발전했습니다. 매일 혼합 결과가 나타납니다.
인간과 대화하려면 0을 누르십시오
오늘날 많은 비즈니스에서는 이제 대화 형 음성 응답 (IVR)이라는 시스템을 사용하여 고객 서비스 요청을 처리합니다. 가장 일반적인 용도는 음성 탐색 메뉴이지만, 일부 회사는 고객 계정 정보에 액세스하고 사소한 질문에 답변 할 수있는 IVR 시스템을 사용합니다. 메뉴 IVR 소프트웨어는 일반적으로 "예", "아니오"및 숫자로 제한되는 어휘가 제한되어 있습니다. 보다 복잡한 시스템은 회사 고유의 단어와 문구를 인식 할 수 있습니다.
이러한 시스템은 간단한 이유로 최소한 비즈니스에서 인기를 얻고 있습니다. 비용 효율적입니다. 월스트리트 저널 (Wall Street Journal)의 2010 년 보고서에 따르면, 상담원 비용이 $ 3에서 $ 9 사이 인 일반적인 고객 통화는 자동화 된 시스템을 통해 처리 된 통화는 5-7 센트에 불과합니다. 물론, 컴퓨터 프로그램은 피곤하거나 아프거나 전화를 걸거나 고객에 대해 불만을 느끼지 않습니다 (고객은 반드시 실망합니다!).
다행스럽게도 이것이 IVR이 사람들로부터 일자리를 빼앗거나 적어도 모든 사람들이 콜센터에서 사라지고 있다는 것을 의미하지는 않습니다. 이러한 음성 지원 헬퍼를 통해 휴먼 고객 서비스 담당자는 전화를 지시하고 간단한 질문에 답변함으로써 생산성을 높일 수 있습니다.
물론 이러한 기술과 상호 작용하는 인간 사용자에게는 항상 원활한 항해가 아닙니다. 기술은 악센트 문제와 같은 IVR 기술의 일반적인 문제를 개선하는 데 도움이되지만 자동화 된 시스템을 점령하는 것은 여전히 온라인에서 일반적인 주제입니다. IVR 시스템에서 오작동이 발생할 수있는 좌절감을 강조하는 음성 인식 기능이있는 엘리베이터에 대해이 코미디 공연을 확인하십시오.
개인 전화 앱 : Siri, Google Now
대부분의 사람들은 스마트 폰의 음성 인식에 익숙합니다. 최신 휴대 전화 모델의 대다수가 VR과 함께 제공되는 반면, 애플이 2011 년 iPhone 4S에 대해 약간 냉소적이며 음성으로 활성화되는 "개인 비서"인 Siri를 출시했을 때 인기와 악명이 높아졌습니다. Google은 곧 직접적인 경쟁자를 만들었습니다. 이제 Android Jelly Bean OS 용 두 시스템 모두 여성 음성과 정교한 인식 기능을 갖추고있어 사용자는 일반적인 언어를 사용하여 전화기와 "통화"할 수 있습니다.
그러나이 시스템은 이전 시스템보다 훨씬 정교하고 기능적이지만 기술은 아직 갈 길이 멀다는 것을 보여줍니다. Siri의 실패에 대한 농담은 인기있는 인터넷 밈이되었습니다. 한 사람은 시리의 능력에 관한 허위 광고로 애플을 고소하기까지했다.
어쩌면 애플이 시리를 발전시키고 유익한 정보로 만들었을 때 VR 소프트웨어도 약간 까다 롭습니다. 예를 들어 1968 년 영화 "2001 : A Space Odyssey"- "Pod Bay Doors 열기"에서 영화 역사상 가장 악명 높은 정보 기술 라인 중 하나를 말하는 경우 Siri는 영화의 응답 라인 중 하나 인 " 죄송합니다. (귀하의 성함), 그렇게 할 수 없을 것 같아요, 또는 더 냉담한 말입니다. "우리 정보 요원은 절대 그런 식으로 살지 않을 것입니다."
이름으로 전화하는 것은 Siri를 더 쉽게 사랑하고 조금 더 인간적으로 만드는 기능 중 하나입니다. VR 어시스턴트는 음성 명령을 따라 전화를 걸고, 받아쓰기를하고, 문자를 보내고, 인터넷 검색을 수행하고, 정보를 검색하고, 인근 상점을 찾거나, 운전 경로 등을 제공 할 수 있습니다. 전화로 답변을 동시에 말하고 화면에 표시합니다.
Android Jelly Bean 플랫폼의 VR 부분 인 Google Now는 Siri와 매우 유사합니다. 이 시스템은 일반 음성을 명령으로 변환하여 사용자가 전화를 걸고 텍스트를 보내며 검색을 수행하고 계산 및 변환을 수행하고 단어 정의를 잡고 알람을 설정하며 노래를 재생하고지도와 방향을 가져올 수있는 동일한 인식 기능을 제공합니다.
Siri 및 Google Now와 같은 개인 음성 도우미를 사용하면 이점이 분명합니다. 전화 및 문자 메시지에서 검색 및 엔터테인먼트에 이르기까지 모든 것이 더 빠르고 쉽습니다. 당신이 원하는 것을 말하고 VR 앱이 당신을 위해 그것을 잡습니다. VR의 핸드 오프 기술은 운전 중에 특히 유용합니다. 그리고 많은 사람들이 시리의 결함을 막아 냈으며, 작가들은 구글 Now의 사용자 생활을 본질적으로 운영하는 능력이 다소 모욕적이라고 주장하지만 대부분의 사람들은 여전히 이러한 미래 기술이 멋지다고 생각합니다.
물론 Siri 및 Google Now와 같은 개인 전화 앱은 완벽하지는 않지만 향후이 기술이 어디로 향할 수 있는지 보여줍니다. 즉, Siri가 잘못된 답변을 제시하더라도 다음 버전이 훨씬 나아질 것이라는 것을 알고 웃으며 용서할 것입니다.
VR이 평평한 곳
업체에 전화를 걸었을 때 IVR을 본 적이 있다면 의사 소통에 대한 특정 장벽을 발견했을 수 있습니다. 일부 프로그램은 단어를 잘못 발음하고 이해하기 어려운 로봇 음성 음성 변환 음성을 사용합니다. 다른 사람들은 민감도 문제가있어 너무 시끄 럽거나 너무 부드럽거나 신중하게 발음하지 않으면 소프트웨어가 말한 내용을 처리 할 수 없습니다.
또한 많은 사람들이 여전히 기계와 대화하는 것을 편안하게 느끼지 못합니다. IVR에서 몇 번의 검색을 수행하면 사람들이 IVR 시스템을 우회하여 "실제 사람"에게 접근하는 방법을 모은 목록이 나타납니다. 이 솔루션의 범위는 "연산자를 위해 계속 0을 누르십시오"에서 "사람을 가져올 때까지 기계를 맹세합니다"까지 다양합니다. 결과적으로, IVR 시스템의 최근 개발의 상당 부분은 인간에게 더 맛있어 보이도록 회전했습니다. 음성을보다 공감하고 로봇 식으로 만들지 않고 시스템을보다 쉽게 탐색 할 수 있으며 발신자에게 모든 것이 처음부터 끝까지 걸리는 시간을 알려줍니다. 그것은 더 나은 기술이 여기서 반 전쟁에 불과하다는 것을 암시합니다. 다른 절반은 사용자가 기계와 대화를 할 수있게하는 것입니다.
미래가 가지고있는 것
이러한 과제에도 불구하고 음성 인식 기술은 항상 향상되고 있습니다. Siri 및 Google Now와 같은 응용 프로그램 (결함 및 모두)은 여전히 뛰어난 성능을 자랑하며 여러 회사에서 VR 기능을 다른 응용 프로그램으로 확장하고 있습니다.
예를 들어 Dragon NaturallySpeaking 음성-텍스트 소프트웨어의 제작자 인 Nuance는 이미 텔레비전과 자동차 용 음성 컨트롤을 개발했으며이 기술 버전은 일부 포드 차량에 사용되는 일부 삼성 TV와 SYNC 엔터테인먼트 시스템에 통합되어 있습니다.
Google과 Apple은 음성 인식 기술에 대한 새로운 용도를 계속 찾아 감에 따라 텔레비전에서 토스트기에 이르기까지 모든 종류의 일상 기기와 점점 더 많은 대화를 나눌 것입니다. 그리고 다시 한 번, 공상 과학 소설이 옳은 것처럼 보입니다. 우리는 그 영리한 작가들이 한 가지 문제에 대해 틀 렸으면 좋겠다. 이러한 기계가 인계받는 경우 다음에 Siri에 "팟 베이 도어를 열도록"요청할 때 많은 문제가 발생할 수 있습니다.