텍스트 음성 변환의 세밀한 제어

음성 생성을 고급으로 제어

시작하기

정규화를 끄면 숫자·날짜·URL 읽기 안정성이 떨어질 수 있습니다. 최상의 결과를 위해 직접 처리하세요.

음소 제어

음소 제어로 단어나 글자의 발음을 정확히 지정할 수 있습니다. 현재 지원:

  • CMU Arpabet(영어)
  • 병음(중국어)

음소 제어 시 발음을 <|phoneme_start|>와 <|phoneme_end|>로 감싸세요. 각 태그에는 단어 또는 글자 하나만 넣습니다.

예시

표준(영): I am an engineer.

제어(영): I am an <|phoneme_start|>EH N JH AH N IH R<|phoneme_end|>.

표준: 我是一个工程师。

제어: 我是一个<|phoneme_start|>gong1<|phoneme_end|><|phoneme_start|>cheng2<|phoneme_end|><|phoneme_start|>shi1<|phoneme_end|>。

부언어

부언어 제어로 자연스러운 발화 요소와 쉼을 넣어 더 사람처럼 들리게 할 수 있습니다. 두 가지 유형이 있습니다.

머뭇거림·간투사

"um", "uh", "嗯", "啊" 같은 일반적인 간투사로 말의 리듬을 조절할 수 있습니다.

특수 효과

아래 특수 효과는 괄호로 추가할 수 있습니다.

효과설명최초 지원단계
(break)짧은 쉼V2실험
(long-break)긴 쉼V2실험
(breath)숨소리V2실험
(laugh)웃음V2실험
(cough)기침V2실험
(lip-smacking)입술 소리V2실험
(sigh)한숨V2실험

(laugh), (cough), (lip-smacking), (sigh)는 개발 중입니다. 더 나은 결과를 위해 여러 번 반복해 보세요.

영어 예:

표준: I am an engineer.

부언어 포함: I am, um, an (break) engineer.

중국어 예:

표준: 我是一名工程师。

부언어 추가: 我,嗯,是一名(break)工程师。