추천 매체
화웨이의 내장 기능을 살펴보고, 화웨이의 TTS 기능을 확장할 수 있는 몇 가지 프로그래밍 기법을 확인해 보세요.
화웨이의 음성 변환 기능
삼성 모바일 기기의 가격이 너무 높거나 대안을 찾고 싶다면 화웨이 폰을 시도해 볼 수 있습니다. 이러한 기기들은 종종 구글 플레이 스토어에 접근할 수 없는 등의 단점이 있지만, 여전히 안드로이드 운영 체제를 실행합니다.
이는 내장된 텍스트 음성 변환 (TTS) 리더를 사용하여 음성 재생을 할 수 있다는 것을 의미합니다. 이를 어떻게 사용하는지 살펴보고, 화웨이의 TTS 기능을 확장할 수 있는 몇 가지 프로그래밍 기법을 확인해 보겠습니다.
화웨이는 어떤 회사인가요?
1987년 설립된 화웨이는 전자 및 통신 기술 분야의 선두주자로 자리 잡았습니다. 이 중국 기업은 170개 이상의 국가에서 운영되며 195,000명의 직원을 고용하고 있습니다.
대부분의 사람들은 화웨이를 스마트폰과 같은 비용 효율적인 모바일 기기 제조업체로 알고 있습니다. 이러한 기기 대부분은 안드로이드 운영 체제의 버전을 사용합니다. 그러나 많은 미국 기업들이 데이터 관련 우려를 가지고 있어 제한이 있습니다.
그럼에도 불구하고, 화웨이는 다양한 유용한 기기와 서비스를 제공하는 세계적인 기술 기업입니다.
화웨이 기기에서 TalkBack TTS 엔진 활성화 방법
화웨이에는 TalkBack라는 내장 텍스트 화면 리더가 있습니다. 이는 애플의 iPhone 및 iPad에서 찾을 수 있는 VoiceOver와 유사하게 작동합니다.
이 앱은 화면에 있는 모든 것을 소리 내어 읽어주는 음성 피드백을 제공합니다. 또한 음성 명령으로 화웨이 폰을 조작할 수 있어 화면을 볼 필요가 없습니다. 따라서 TalkBack은 시각 장애인에게 이상적입니다.
TalkBack을 활성화하는 방법은 다음과 같습니다:
- “설정”을 열고 “접근성 기능”을 선택합니다.
- “접근성”을 탭합니다.
- “TalkBack”을 선택하고 소프트웨어를 활성화합니다.
- “확인”을 탭합니다.
TalkBack 비활성화
TalkBack을 끄려면, 휴대폰의 전원 버튼을 길게 눌러 “재시작” 및 “전원 끄기” 아이콘이 표시될 때까지 기다립니다. 그런 다음 화면을 터치하고 3초 동안 눌러 TalkBack을 비활성화합니다.
텍스트를 음성으로 변환하기
TalkBack이 활성화되면, 디지털 텍스트를 음성으로 변환하려면 다음을 수행하십시오:
- “설정”을 열고 “접근성” 화면으로 이동합니다.
- “텍스트 음성 변환”을 탭하고 원하는 텍스트 음성 변환 엔진을 선택합니다.
- 음성 속도와 음조를 원하는 대로 조정합니다.
이 단계를 사용하여 화웨이 기기에 설치된 모든 TTS 앱에서 텍스트 음성 변환을 켤 수 있습니다. 활성화되면, 휴대폰은 화면에 보이는 모든 텍스트 정보를 소리 내어 읽어줍니다.
MLTtsengine.speak를 사용하여 안드로이드 애플리케이션에 음성 추가하기
화웨이 기기에는 MLTtsengine.speak 개발 키트가 있습니다. 이 키트를 사용하면 기기를 사용하여 만든 모든 안드로이드 앱에 텍스트 음성 변환 기능을 추가할 수 있습니다.
개발자 Tushar Srivastava의 정보를 사용한 기본 단계는 다음과 같습니다:
- Android Studio를 사용하여 새 프로젝트를 만듭니다.
- 다음 종속성을 프로젝트에 추가합니다:
- implementation 'com.huawei.hms:ml-computer-voice-tts:1.0.4.300'
- 다음 코드를 사용하여 app.gradle 파일 상단에 AGC 플러그인을 추가합니다:
- apply plugin: 'com.huawei.agconnect'
- 다음 코드를 사용하여 Android Studio 활동에 콜백을 만듭니다:
var callback: MLTtsCallback = object : MLTtsCallback {
override fun onError(taskId: String, err: MLTtsError) {
}
override fun onWarn(taskId: String, warn: MLTtsWarn) {
}
override fun onRangeStart(taskId: String, start: Int, end: Int) {
}
override fun onEvent(taskId: String, eventName: Int, bundle: Bundle?) {
if (eventName == MLTtsConstants.EVENT_PLAY_STOP) {
val isStop = bundle?.getBoolean(MLTtsConstants.EVENT_PLAY_STOP_INTERRUPTED)
}
}
- 다음 코드 줄을 사용하여 객체를 초기화하세요:
mlConfigs = MLTtsConfig()
.setLanguage(MLTtsConstants.TTS_EN_US)
.setPerson(MLTtsConstants.TTS_SPEAKER_FEMALE_EN)
.setSpeed(1.0f)
.setVolume(1.0f)
mlTtsEngine = MLTtsEngine(mlConfigs)
mlTtsEngine.setTtsCallback(callback)
- 앱에서 버튼 클릭으로 텍스트 음성 출력을 사용할 수 있도록 활동에 아래 메서드를 만드세요:
private fun startTtsService() { val id = mlTtsEngine.speak(sourceText,MLTtsEngine.QUEUE_APPEND)}
유용한 콜백 메서드
화웨이 API는 앱에서 오디오 데이터와 텍스트 음성을 사용하는 여러 콜백 메서드를 제공합니다. 여기 가장 일반적인 네 가지가 있습니다.
Public void onError()
오류가 발생하면 제어 흐름이 이 오류 콜백으로 이동합니다. 이는 앱 사용자에게 오류가 발생했음을 알리고 적절한 장소로 분석 데이터를 보내도록 요청하는 데 사용됩니다.
Public void onWarn()
사용자가 앱에 충분한 대역폭이 없는 경우와 같은 경고를 경험하면 콜백이 이곳으로 흐릅니다.
Public void onEvent()
사용자가 오디오를 일시 중지하는 등의 새로운 이벤트가 발생할 때마다 이 콜백을 사용하세요.
Public void onRangeStart()
이 콜백은 현재 재생 중인 구간과 사용자가 읽고자 하는 텍스트 간의 매핑을 반환합니다.
추가 참고 사항
새로운 mlttscallback 루틴을 만들 때 제한이 있습니다. 위의 예에서 문자는 UTF-8로 인코딩되며 500자 제한이 있습니다.
장점으로는, 이 기능이 영어, 중국어(만다린) 및 두 언어의 조합에서 남성과 여성의 목소리를 지원한다는 점입니다.
Speechify - Talkback의 대안
화웨이 기기를 사용하여 기기 내 텍스트를 읽는 것은 복잡할 수 있습니다. 그러나 프로그래밍에 관심이 없다면, 대체 텍스트 음성 앱이 실시간으로 모든 텍스트를 읽어줄 수 있습니다.
그 앱이 Speechify입니다.
모든 안드로이드 기기에서 사용할 수 있는 Speechify는 음성 합성 기술을 사용하여 여러 음색의 인간 같은 목소리를 제공합니다. 사용자는 14개 이상의 언어 중에서 선택하고 읽기 속도를 조절할 수 있습니다.
앱을 사용하지 않을 때는 그냥 종료하고 평소처럼 텍스트를 읽을 수 있습니다.
화웨이 기기에서 Speechify가 어떻게 작동하는지 더 알고 싶다면, 오늘 무료 체험을 해보세요. 브라우저에서도 리더를 사용할 수 있습니다.
자주 묻는 질문
화웨이에서 텍스트 음성을 어떻게 켜나요?
이 기사에 있는 지침을 사용하여 TalkBack 앱을 활성화하세요.
화웨이에서 어떻게 음성 입력을 하나요?
기기의 “제어판”에 들어가 “접근성”으로 이동하세요. “음성 인식”을 선택하고 “음성 인식 시작”을 탭하세요.
안드로이드에 텍스트 음성 변환 기능이 있나요?
TalkBack 외에도, 안드로이드 폰에서 사용할 수 있는 다양한 TTS 엔진이 있습니다.
타일러 와이츠먼
타일러 와이츠먼은 세계 최고의 텍스트 음성 변환 앱인 Speechify의 공동 창립자이자 인공지능 책임자 및 사장입니다. 이 앱은 10만 개 이상의 5성급 리뷰를 보유하고 있습니다. 와이츠먼은 스탠포드 대학교에서 수학 학사와 인공지능 트랙의 컴퓨터 과학 석사를 취득했습니다. 그는 Inc. 매거진에서 선정한 50대 기업가 중 한 명으로 선정되었으며, Business Insider, TechCrunch, LifeHacker, CBS 등 여러 매체에 소개되었습니다. 와이츠먼의 석사 학위 연구는 인공지능과 텍스트 음성 변환에 중점을 두었으며, 그의 최종 논문 제목은 “CloneBot: 개인화된 대화 응답 예측”이었습니다.