NAVER CLOUD PLATFORM

Platform 2.0 전용

Clova Speech Recognition(CSR)

사람의 목소리를 텍스트로 바꿔주어 다양한 음성 인식 서비스에 활용할 수 있습니다

가장 뛰어난 한국어 음성 인식률을 가진 음성 인식 API

사람의 목소리를 인식하여 작동하는 비서 애플리케이션, 챗봇, 음성 메모 등의 서비스를 만들 때 활용할 수 있는 음성 인식 API 서비스입니다. 음성 데이터는 API를 통해 Clova Speech Recognition(CSR) 엔진으로 전송되며, 해당 음성 데이터를 인식해서 텍스트로 변환하여 전달해줍니다.

높은 인식률 및 다양한 언어 지원
네이버에서 수년간 연구해온 결과로 국내에서 가장 뛰어난 한국어 인식률을 자랑합니다. 한국어 외에도 영어, 일어, 중국어(간체)를 지원합니다. 네이버 Clova 서비스에 적용된 음성 인식 기술과 동일한 수준의 서비스를 이용할 수 있습니다.
학습을 통해 높아지는 성능
인공지능 기술 중에 하나인 머신 러닝(Machine Learning)을 바탕으로 다양한 학습을 통해 지속적으로 품질 향상이 됩니다. 네이버 서비스에서 얻어지는 풍부한 데이터를 기반으로 점점 더 똑똑해지고 있는 Clova Speech Recognition(CSR)을 이용해서 고객 서비스의 성능을 높여가세요.
안전한 개인정보 관리
음성 인식을 위해 입력되는 정보들을 안전하게 보호하기 위해, Clova Speech Recognition(CSR)은 개인정보 보호법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 등 국내의 개인정보 보호 법령을 준수합니다.
손쉬운 사용
웹 기반의 콘솔에서 서비스 등록(등록, 변경, 삭제), 이용량 상한선 설정(일별/월별), 이용량 통계조회 등 다양한 관리 작업을 편리하게 처리할 수 있습니다. 아울러 모바일 SDK와 REST API 방식을 모두 제공하므로, 다양한 모바일 뿐만 아니라 서버 등 다양한 환경에서 폭넓게 이용할 수 있습니다.

상세기능

네이버의 풍부한 데이터를 기반으로 학습된 품질 높은 음성 인식 서비스를 제공합니다.

제공 서비스

CSR 모바일 SDK 및 API를 이용하여 사람의 목소리를 전송하면 서버에서 인식 결과를 텍스트로 리턴합니다.
HTTP기반의 REST API와, 자체 스트리밍 프로토콜을 구현한 모바일 SDK 형태가 제공됩니다.

이용 방식지원 플랫폼인식 가능 언어인식 가능 시간인식 가능 음성파일 포맷CSR 엔진 전달 데이터
모바일 SDKAndroid 10 이상한국어, 영어, 일본어, 중국어60초-마이크로 입력된 음성
iOS 8 이상
REST API-mp3, aac, ac3, ogg, flac, wav녹음 파일

API 이용

CSR 모바일 SDK를 이용한 애플리케이션은 API 인증을 위해 Client ID와 Android 애플리케이션의 개발 패키지 이름을 이용하며, REST API는 Client ID와 Client Secret을 이용하여 인증합니다. 인증부터 API 이용까지 데이터 전송 구간은 모두 암호화를 적용할 수 있습니다.

활용 사례

텍스트 입력이나 물리적인 방법으로만 사용하던 서비스를 음성으로 컨트롤하는데 활용할 수 있습니다.
가전 제품 및 공동 주택의 홈 네트워크 제어, 배달 주문, 금융 서비스 등에 적용 가능합니다.
모바일 SDK를 이용하여 스마트폰 애플리케이션으로 다양한 비서 서비스 등을 구현하는데 이용할 수 있으며, REST API를 이용하면 축적된 음성 데이터 파일을 텍스트로 변환하는데 활용할 수 있습니다.

서비스 이용 한도

- 서비스 콘솔에서 Clova Speech Recognition API 이용 한도를 직접 조정할 수 있습니다.
- 애플리케이션 당 월 300,000초(일 10,000초)에서 월 30,000,000초(일 10,000,000초)까지 원하는 수준으로 이용량 한도를 선택할 수 있습니다.
- 서비스 이용량은 과금 기준인 15초 단위로 올림하여 계산되니 이용에 참고하시기 바랍니다.
- 이용 한도를 초과하는 마지막 호출에 대해서는 호출이 허용됩니다. (과금은 실제 호출한 이용량 기준으로 산정됩니다.)
예시) 월 이용 한도를 1,000초로 설정한 경우, 990초를 이용한 상태에서 15초를 추가 호출하면 총 1005초를 이용할 수 있으며, 1005초 기준으로 과금됩니다.
- 서비스 이용량에 대한 추가 한도 상향이 필요한 경우, 고객지원으로 문의해주시기 바랍니다.


요금 안내

CSR 이용요금은 음성 인식 이용시간 기준으로 15초 당 단위로 부과됩니다.

과금 기준 (월)단위이용 요금(원)
음성 인식 이용시간 (음성 인식 요청~종료)이용시간(15초 단위)15초당 4원
  • 이용시간은 15초 단위로 올림됩니다.
  • API 호출 1회당 인식할 수 있는 음성은 60초까지 가능합니다.
  • 음성 인식 요청 후 종료까지의 시간을 측정하여 이용시간으로 계산합니다. 즉 인식 요청하는 스트림 또는 파일의 중간에 묵음 구간 등의 공백이 있어도 이용시간에 포함됩니다.
  • 모바일 SDK와 REST API에는 동일한 요금제가 적용됩니다.
요금 예시

Case 1) CSR을 10초간 이용했을 경우: 4원이 과금됨.
Case 2) CSR을 32초간 사용했을 경우: 12원이 과금됨.
Case 3) CSR을 65초간 사용했을 경우: 제한 시간인 60초까지만 인식되며, 16원이 과금됨.

현재 보고 계신 페이지 내용이 도움이 되셨나요?

아쉬운 점이 있다면 이야기해 주세요.
0/5000
내용을 입력해 주세요
의견 보내기