NAVER CLOUD PLATFORM

고객사례

네이버 클라우드 플랫폼을 통해 안전하고 효율적인 서비스를 제공하고 있는 기업들을 소개합니다


다양한 음성 인식 API를 사용해봤지만, Clova Speech Recognition(CSR)처럼 간결한 코드로 쉽게 사용할 수 있는 서비스는 없었습니다.
네이버 클라우드 플랫폼의 CSR은 빠른 속도는 물론 5가지 음성 분석 결과 중 개발품에 가장 적절한 것을 선택할 수 있다는 것이 큰 장점입니다. 음성 인식 외에도 네이버의 다양한 인공지능(AI) API를 손쉽게 활용할 수 있는 것도 좋은 것 같습니다. 추후에는 네이버 클라우드 플랫폼의 얼굴 인식 API인 Clova Face Recognition(CFR) 상품을 사용해 발음연습기기 애플리케이션을 업그레이드 해나갈 계획입니다.
Interview
신지우, 이지은, 임지수
3G 개발팀
회사 소개를 부탁드립니다.
저희가 만든 앱 ‘발연기‘는 ‘발음 연습 기기‘의 약자로, 청소년 청각장애인들이 발음을 연습할 수 있도록 도와주는 발음 교정 애플리케이션입니다.
저희는 덕성여대에 재학 중인 동기로, ‘늘푸른 소리’라는 동아리 활동을 하며 IT 교육 봉사를 해왔습니다. 발음 연습 애플리케이션을 개발해야겠다고 처음 생각하게 된 건 2년 전, ‘청음 회관’이라는 청각장애인 복지 단체에서 청소년 청각장애인 IT 교육 봉사를 하던 중에 인공와우를 이식 받은 친구들을 만났을 때였습니다. 이 친구들 같은 경우에는 후천적으로 들을 수 있게 된 것이기 때문에 꾸준한 발음 교정 연습이 필요한데요. 하지만 국내에는 언어치료기관의 수가 매우 부족하고 그마저도 수도권에 밀집되어 있어서 친구들이 언어 치료에 어려움을 겪는다는 것을 알게 되었습니다. 저희는 이를 돕고자 집에서도 편하게 발음 연습을 할 수 있는 앱을 제작하기로 마음 먹었습니다. 때마침 좋은 기회로, 2017년에 정부의 ICT인재양성사업인 '한이음 ICT 멘토링'에 참여하게 되었는데요. 거기서 '3G'라는 이름의 팀을 멘토님과 함께 구성해 청각장애인이 발음을 듣고 연습할 수 있는 앱을 본격적으로 개발했습니다. 사용자가 먼저 발음을 듣고 따라서 발음하면 정확도를 확인할 수 있는 연습 기능과 실제 언어치료사에게 자신의 발음을 피드백받을 수 있는 숙제 기능 등을 제공합니다.​
네이버 클라우드 플랫폼을 언제부터, 어떻게 사용하게 되셨나요?
2017년 9월부터 네이버 클라우드 플랫폼의 Clova Speech Recognition(CSR)을 사용해왔습니다.
저희 앱은 사용자의 발음을 텍스트로 변환하는 STT 기능을 필요로 하기 때문에 STT 오픈 소스를 찾아다녔었습니다. 처음에는 해외 클라우드사 STT 기능을 사용했었는데요. 변환하기까지의 속도가 갈수록 점점 느려져서 제대로 작동하지 않게 되어 다른 STT 소스를 찾던 중, 네이버 클라우드 플랫폼의 Clova Speech Recognition(이하 CSR)을 발견해서 사용하게 되었습니다. 타사 STT 기능에서 나타나던 오류도 나타나지 않았고, 무엇보다 음성을 텍스트로 변환해주는 수준을 필요에 맞게 선택할 수 있는 점이 가장 좋았습니다. 저희 같은 경우에는 사용자의 발음을 자동으로 바꾸어 출력해주는 자동 완성 기능이 오히려 도움이 되지 않는 기능이예요. 사용자의 음성이 정확하게 텍스트로 출력되어야 발음을 제대로한 건지, 교정이 필요한지 알 수 있으니까요. 그런 면에서 타사는 한 가지 출력 품질만 제공해서 불편한 반면, 네이버 클라우드 플랫폼의 CSR은 출력 품질을 5가지로 제공하고 있어서 사용자의 발음 그대로 출력될 수 있도록 세팅할 수 있어 좋았습니다.
네이버 클라우드 플랫폼을 선택한 이유는 무엇인가요?
높은 한국어 인식률과 손쉬운 사용, 그리고 좋은 가격 때문에 선택했습니다.
첫째는 높은 한국어 인식률입니다. 저희는 사용자의 정확한 발음을 인식해야 하는 것이 중요한데요. 클로바의 음성 인식 기술은 아무래도 한국 기업인 네이버가 만들어서 그런지 한국어 인식률이 매우 뛰어나서 좋은 것 같습니다. 둘째는 손쉬운 사용법 때문입니다. 샘플 소스가 주석과 함께 알기 쉽게 업로드 되어 있어서 초심자가 사용하기 매우 쉽습니다. 뿐만 아니라 홈페이지에 에러 코드에 대한 설명도 자세히 나와 있어 에러가 나더라도 원인을 쉽게 분석할 수 있어 개발이 편했습니다. 마지막으로는 가격입니다. CSR뿐만 아니라 네이버 클라우드 플랫폼의 대부분의 상품들이 타 클라우드에 비해 가격대가 좋게 형성된 것 같습니다. 학생 신분으로도 크게 부담스럽지 않게 사용할 수 있는 점도 선택의 이유였습니다.
네이버 클라우드 플랫폼을 실제 어떻게 사용하고 계시고, 함께 한 후 어떤 점들이 좋아지셨나요?
변환 속도가 훨씬 빨라졌고, 코드도 눈에 띄게 짧아졌고, 음성인식 정확도도 높아졌습니다.
처음에 타사의 음성 인식 API를 사용했을 때 '느린 속도'에 대한 문제가 늘 걸림돌이었습니다. 음성이 텍스트로 변환되는 시간이 문장의 길이에 비례하여 점점 더 늦어져서 나중에는 사용 자체가 어려웠었는데요. CSR로 바꾼 후에는 이런 불편이 모두 해결되었습니다. 코드도 눈에 띄게 짧아져서 유지보수도 훨씬 간편해졌고, 변환된 텍스트 중 취향에 맞는 데이터를 선택하여 사용할 수 있는 점도 매우 좋았습니다. 덕분에 사용자가 발음한 소리를 객관적으로 확인할 수 있게 됐고 발음 교정 효과도 극대화할 수 있게 됐습니다.
마지막으로, 네이버 클라우드 플랫폼 선택을 고민하시는 분들께 도움이 될 수 있는 의견 부탁드립니다.
다양한 음성인식 API를 사용해봤지만, CSR처럼 간결한 코드로 쉽게 사용할 수 있는 음성인식 서비스는 없었습니다.
네이버 클라우드 플랫폼의 CSR은 빠른 속도는 물론 5가지 음성 분석 결과 중 개발품에 가장 적절한 것을 취사선택할 수 있다는 점이 큰 장점인 것 같습니다. 음성 인식 기술을 사용한 서비스를 계획 중인데 어떤 API를 쓸지 고민이시라면, 네이버 클라우드 플랫폼을 선택하는 것이 처음부터 쉬운 길로 갈 수 있는 것이라고 말씀드릴 수 있을 것 같습니다. 음성 인식 외에도 네이버의 다양한 인공지능(AI) API를 손쉽게 활용할 수 있는 것도 좋은 것 같아요. 추후에 저희는 네이버 클라우드 플랫폼의 얼굴 인식 API인 Clova Face Recognition(CFR) 상품을 사용해 발음연습기기 애플리케이션을 업그레이드해나갈 계획입니다. 사용자의 음성 뿐만 아니라 입 모양까지 함께 분석한다면 더욱 효과적으로 발음 교정을 할 수 있을 것 같아서요. 네이버 클라우드 플랫폼의 기술들을 잘 활용해서 앞으로 더 많은 친구들의 언어 치료를 도울 예정입니다. '발연기'도 파이팅! '네이버 클라우드 플랫폼'도 파이팅입니다!
회사 소개를 부탁드립니다.
저희가 만든 앱 ‘발연기‘는 ‘발음 연습 기기‘의 약자로, 청소년 청각장애인들이 발음을 연습할 수 있도록 도와주는 발음 교정 애플리케이션입니다.
저희는 덕성여대에 재학 중인 동기로, ‘늘푸른 소리’라는 동아리 활동을 하며 IT 교육 봉사를 해왔습니다. 발음 연습 애플리케이션을 개발해야겠다고 처음 생각하게 된 건 2년 전, ‘청음 회관’이라는 청각장애인 복지 단체에서 청소년 청각장애인 IT 교육 봉사를 하던 중에 인공와우를 이식 받은 친구들을 만났을 때였습니다. 이 친구들 같은 경우에는 후천적으로 들을 수 있게 된 것이기 때문에 꾸준한 발음 교정 연습이 필요한데요. 하지만 국내에는 언어치료기관의 수가 매우 부족하고 그마저도 수도권에 밀집되어 있어서 친구들이 언어 치료에 어려움을 겪는다는 것을 알게 되었습니다. 저희는 이를 돕고자 집에서도 편하게 발음 연습을 할 수 있는 앱을 제작하기로 마음 먹었습니다. 때마침 좋은 기회로, 2017년에 정부의 ICT인재양성사업인 '한이음 ICT 멘토링'에 참여하게 되었는데요. 거기서 '3G'라는 이름의 팀을 멘토님과 함께 구성해 청각장애인이 발음을 듣고 연습할 수 있는 앱을 본격적으로 개발했습니다. 사용자가 먼저 발음을 듣고 따라서 발음하면 정확도를 확인할 수 있는 연습 기능과 실제 언어치료사에게 자신의 발음을 피드백받을 수 있는 숙제 기능 등을 제공합니다.​
네이버 클라우드 플랫폼을 언제부터, 어떻게 사용하게 되셨나요?
2017년 9월부터 네이버 클라우드 플랫폼의 Clova Speech Recognition(CSR)을 사용해왔습니다.
저희 앱은 사용자의 발음을 텍스트로 변환하는 STT 기능을 필요로 하기 때문에 STT 오픈 소스를 찾아다녔었습니다. 처음에는 해외 클라우드사 STT 기능을 사용했었는데요. 변환하기까지의 속도가 갈수록 점점 느려져서 제대로 작동하지 않게 되어 다른 STT 소스를 찾던 중, 네이버 클라우드 플랫폼의 Clova Speech Recognition(이하 CSR)을 발견해서 사용하게 되었습니다. 타사 STT 기능에서 나타나던 오류도 나타나지 않았고, 무엇보다 음성을 텍스트로 변환해주는 수준을 필요에 맞게 선택할 수 있는 점이 가장 좋았습니다. 저희 같은 경우에는 사용자의 발음을 자동으로 바꾸어 출력해주는 자동 완성 기능이 오히려 도움이 되지 않는 기능이예요. 사용자의 음성이 정확하게 텍스트로 출력되어야 발음을 제대로한 건지, 교정이 필요한지 알 수 있으니까요. 그런 면에서 타사는 한 가지 출력 품질만 제공해서 불편한 반면, 네이버 클라우드 플랫폼의 CSR은 출력 품질을 5가지로 제공하고 있어서 사용자의 발음 그대로 출력될 수 있도록 세팅할 수 있어 좋았습니다.
네이버 클라우드 플랫폼을 선택한 이유는 무엇인가요?
높은 한국어 인식률과 손쉬운 사용, 그리고 좋은 가격 때문에 선택했습니다.
첫째는 높은 한국어 인식률입니다. 저희는 사용자의 정확한 발음을 인식해야 하는 것이 중요한데요. 클로바의 음성 인식 기술은 아무래도 한국 기업인 네이버가 만들어서 그런지 한국어 인식률이 매우 뛰어나서 좋은 것 같습니다. 둘째는 손쉬운 사용법 때문입니다. 샘플 소스가 주석과 함께 알기 쉽게 업로드 되어 있어서 초심자가 사용하기 매우 쉽습니다. 뿐만 아니라 홈페이지에 에러 코드에 대한 설명도 자세히 나와 있어 에러가 나더라도 원인을 쉽게 분석할 수 있어 개발이 편했습니다. 마지막으로는 가격입니다. CSR뿐만 아니라 네이버 클라우드 플랫폼의 대부분의 상품들이 타 클라우드에 비해 가격대가 좋게 형성된 것 같습니다. 학생 신분으로도 크게 부담스럽지 않게 사용할 수 있는 점도 선택의 이유였습니다.
네이버 클라우드 플랫폼을 실제 어떻게 사용하고 계시고, 함께 한 후 어떤 점들이 좋아지셨나요?
변환 속도가 훨씬 빨라졌고, 코드도 눈에 띄게 짧아졌고, 음성인식 정확도도 높아졌습니다.
처음에 타사의 음성 인식 API를 사용했을 때 '느린 속도'에 대한 문제가 늘 걸림돌이었습니다. 음성이 텍스트로 변환되는 시간이 문장의 길이에 비례하여 점점 더 늦어져서 나중에는 사용 자체가 어려웠었는데요. CSR로 바꾼 후에는 이런 불편이 모두 해결되었습니다. 코드도 눈에 띄게 짧아져서 유지보수도 훨씬 간편해졌고, 변환된 텍스트 중 취향에 맞는 데이터를 선택하여 사용할 수 있는 점도 매우 좋았습니다. 덕분에 사용자가 발음한 소리를 객관적으로 확인할 수 있게 됐고 발음 교정 효과도 극대화할 수 있게 됐습니다.
마지막으로, 네이버 클라우드 플랫폼 선택을 고민하시는 분들께 도움이 될 수 있는 의견 부탁드립니다.
다양한 음성인식 API를 사용해봤지만, CSR처럼 간결한 코드로 쉽게 사용할 수 있는 음성인식 서비스는 없었습니다.
네이버 클라우드 플랫폼의 CSR은 빠른 속도는 물론 5가지 음성 분석 결과 중 개발품에 가장 적절한 것을 취사선택할 수 있다는 점이 큰 장점인 것 같습니다. 음성 인식 기술을 사용한 서비스를 계획 중인데 어떤 API를 쓸지 고민이시라면, 네이버 클라우드 플랫폼을 선택하는 것이 처음부터 쉬운 길로 갈 수 있는 것이라고 말씀드릴 수 있을 것 같습니다. 음성 인식 외에도 네이버의 다양한 인공지능(AI) API를 손쉽게 활용할 수 있는 것도 좋은 것 같아요. 추후에 저희는 네이버 클라우드 플랫폼의 얼굴 인식 API인 Clova Face Recognition(CFR) 상품을 사용해 발음연습기기 애플리케이션을 업그레이드해나갈 계획입니다. 사용자의 음성 뿐만 아니라 입 모양까지 함께 분석한다면 더욱 효과적으로 발음 교정을 할 수 있을 것 같아서요. 네이버 클라우드 플랫폼의 기술들을 잘 활용해서 앞으로 더 많은 친구들의 언어 치료를 도울 예정입니다. '발연기'도 파이팅! '네이버 클라우드 플랫폼'도 파이팅입니다!

  • 도입 배경

    • 사용자의 발음을 텍스트로 변환하는 음성 인식 기능이 필요
    • 타사 음성 인식 API 사용 시 느린 속도와 텍스트 변환 결과에 대한 이슈 존재
  • 활용 형태

    • Clova Speech Recognition(CSR) 사용해 사용자의 음성을 텍스트로 빠르고 정확하게 변환
    • 텍스트 변환 결과값 5가지 중 적절한 결과를 선택 사용
  • 적용 효과

    • 높은 한국어 인식률로 사용자의 정확한 발음 인식 가능
    • 간결해진 코드로 더욱 간편해진 유지보수
    • 월등히 빨라진 변환 속도