소프트웨어 음성 합성이란 무엇입니까? -techopedia에서 정의

음성 합성이란 무엇입니까? -techopedia에서 정의

차례:

Anonim

정의-음성 합성이란 무엇입니까?

음성 합성은 컴퓨터 또는 다른 장치에 의한 인간 음성의 인공 시뮬레이션입니다. 음성 인식의 대응 인 음성 합성은 주로 텍스트 정보를 오디오 정보로 변환하고 음성 지원 서비스 및 모바일 애플리케이션과 같은 애플리케이션에서 사용됩니다. 이 외에도, 시각 장애가있는 개인이 텍스트 컨텐츠를 읽을 수 있도록 보조 기술에도 사용됩니다.

Techopedia는 음성 합성을 설명합니다

Bell Laboratories의 보코더를 기반으로 한 Homer Dudley의 VODER는 완전한 기능을 갖춘 최초의 음성 신시사이저로 간주됩니다. 음성 합성에 사용되는 컴퓨터를 음성 합성기 또는 음성 컴퓨터라고합니다. 음성 컴퓨터의 품질은 종종 사람의 음성과의 유사성으로 판단됩니다. 대부분의 컴퓨터 운영 체제는 1990 년대 초부터 음성 합성기를 통합했습니다. 합성 된 음성은 일반적으로 데이터베이스에 포함 된 녹음 된 음성 조각을 연결하여 생성됩니다.

음성 합성의 초기 단계는 사전 처리로 특정 단어를 읽어야하는 방식을 둘러싼 모호성을 없애고 호모 그래프 처리도 포함합니다. 음성 합성의 다음 단계에서, 컴퓨터는 음소의 도움을 받아 텍스트를 일련의 사운드로 변환합니다. 마지막 단계는 사람의 음성 메커니즘을 모방하고 전체 텍스트를 읽는 사람 녹음 또는 기본 사운드 생성 기술을 사용하는 것입니다. 널리 사용되는 음성 합성 분야 중 하나는 시청각 음성 합성 또는 멀티 모달 음성 합성으로, 합성 된 음성을 보완하기 위해 긴밀하게 동기화 된 애니메이션 얼굴을 사용합니다. 멀티 모달 음성 합성은 또한 비언어적 신호와 같은 추가 기능을 음성에 통합하여 사용자의 단어를보다 정확하게 전달하는 데 도움을줍니다. 많은 음성 합성 시스템을 통해 사용자는 남성 또는 여성 음성과 같은 음성 유형을 선택할 수 있습니다.

대부분의 음성 합성 시스템은 때때로 음성이 흐릿 할 수 있지만 텍스트를 읽고 매우 지능적인 방식으로 출력 할 수 있습니다. 그러나 음성 합성은 아직 광범위한 인간 억양 및 케이던스를 완전히 모방하는 능력을 개발하지 못하고 있습니다.

음성 합성이란 무엇입니까? -techopedia에서 정의