Search
🛠️

제로스 음성인식 기술

ZEROTH ENTERPRISE 소개

높은 음성 인식률을 갖춘 솔루션을 제공합니다.
Zeroth 칼디(Kaldi)를 기반으로 개발되었습니다. 실시간 모듈, 2,000시간 음향 모델을 지원하며 어떠한 비즈니스에 최적화하여 적용할 수 있는 음성인식 솔루션입니다.

음성인식 | Automatic Speech Recognition

STT(Speech-to-Text)
음성 스트리밍 인식 (Speech Stream Recognizing)
멀티 채널 지원 (Multi-channel Support)
구문 힌트 (Phrase Hints)

자연어 이해 | Natural Language Understanding

개체명 추출 (Named Entity Extraction)
의도 감지 (Intent Detection)
유형 분류 (Document Classification)
검색 기반 추천 답변 시스템 (Retrieval-based Recommender System)
🧐
더 많은 내용은 소개서를 통해서 확인할 수 있습니다. → 소개서 다운로드 (링크)

ZEROTH ENTERPRISE 강점

도메인 최적화, 실시간 음성 인식, 다양한 결과 출력 형식을 통해 음성 인식의 활용을 높일 수 있습니다

도메인 최적화 (Domain Optimization)

Embedded : 단말기 리소스(CPU, Memory)를 활용한 경량화 시스템을 사용합니다.
서버형(Cloud) : 단말기는 음성만 캡처하여 서버로 전송하며, 서버에서 음성 인식 후 단말기로 결과를 전송합니다.

실시간 음성 인식

Sequential(online) : 순차적으로 입력되는 음성을 처리하는 스트리밍 형태로 처리합니다.
Batch :전체 데이터가 들어오는 경우에 음성 인식을 수행합니다.

다양한 결과 출력 형식

키워드 기반 : 정의된 키워드만을 출력합니다.
LVCSR : 발화한 모든 결과를 출력합니다.
*대용량 연속 음성 인식 :LVCSR(Large Vocabulary Continuous Speech Recognition)

최신 기술 업데이트 가능 (Kaldi-based 음향모델)

Kaldi 기반으로 음향모델을 개발했기 때문에 지속적으로 최신기술을 적용할 수 있습니다.
*칼디는 음성 인식기에 최적화된 프레임워크로 최근 음성 인식 기술은 대부분 칼디를 활용하고 있습니다. 음성 인식기 구축에 필요한 모든 과정을 포함하고 있습니다.

경량화 시스템

Embedded : 단말기 리소스(CPU, Memory)를 활용한 경량화 시스템을 사용합니다.
서버형(Cloud) : 단말기는 음성만 캡처하여 서버로 전송하며, 서버에서 음성 인식 후 단말기로 결과를 전송합니다.

CPU만으로 디코딩 가능

자체 개발한 실시간 음성인식, 자연어 처리, 음성합성 엔진을 이용해 빠르고 정확하게 동작합니다.
GPU에 대한 비용이 감소합니다.

ZEROTH OPEN-SOURCE PROJECT

가장 먼저 한국어 음성 인식 오픈소스 프로젝트를 진행했습니다.

[오픈소스 확인하기]

비즈니스 환경에 최적화된 높은 음성 인식률을 달성합니다.

소음 환경에서도 어려운 발음, 숫자, 영어를 정확하게 인식합니다. 언어 모델과 음향 모델의 도메인 최적화 시 음성 인식률을 ~98%로 높일 수 있으며, 한국어에 특화된 STT와 NLU 솔루션을 제공합니다. [Demo]

주요 포트폴리오

다양한 프로젝트 경험을 통해 우수한 기술력을 검증받았습니다.

모바일 앱 음성 인터페이스 프로젝트를 진행했습니다. YES24 모바일 앱 사용자는 음성 검색을 통해 상품 구매하거나 일대일 상담을 할 수 있습니다. 정확하게 상품명을 인식하기 위해 구문 학습 기능과 자연어 처리 기술을 사용했습니다
지능형 컨택센터 STT 시스템을 구축하였습니다. AI 상담 어드바이저가 고객과의 통화 내용을 실시간으로 텍스트로 변환하고, AI는 대화 내용을 분석하여 고객의 문의 사항에 알맞은 답변을 상담원에게 빠르게 추천합니다.
음성을 텍스트로 변환하는 Dictation 서비스로 포스코 그룹 운영 회의, 이사회, 강연/세미나/교육 동영상 파일 및 녹음파일을 Zeroth EE를 통해 문자로 변환 기록합니다. 음성 콘텐츠에 대한 검색, 텍스트 마이닝 분석에도 사용되고 있습니다.
기존에 식당에서 오뚜기 상담원에게 전화를 걸어 직접 식자재 주문을 받던 형태에서 "음성 주문 접수처리 AI 챗봇 시스템” 음성 봇의 STT 부분에 Zeroth EE 엔진을 사용하여 시스템을 구축하였습니다.
TOP