무려 실시간 추론이 됩니다!
그게 뭔데 씹덕아? 라고 물으신다면
민트선배나 로슈 처럼 목소리를 실시간으로 변환하는 기능입니다
이걸 정해진 피치만 올리는게 아닌, 내가 원하는 모델의 목소리로 실시간 변환을 하는 기능이구요
RVC 원본에도 있는 기능이긴 했습니다만 빈약해서 다른 툴의 보조를 받아야 했던건데
mangio-RVC에선 이걸 좀 만져놔서 쓸 수 있게 만들어 놨네요
rmvpe를 이용해 빠르게 추론하기 때문에 딜레이가 예전에 비해 대폭 감소했습니다
Mangio-RVC가 깔린 폴더에서 다음 파일을 찾습니다
go-realtime-gui-v1.bat을 실행시킵니다
new는 아직 미완성이라 실행시키면 응 답없음 상태고
나머지 버전은 rmvpe가 없네요
실행시키면 다음과 같은 창이 나옵니다
젤 위는 위칸에 모델, 아래칸에 인덱스 파일 경로를 지정해주면 됩니다
당연히 같은 모델이면 같은 인덱스를 넣어야 합니다
두번째칸은 사운드 장비입니다
저부분은 방송용 오인페 라던가 제 선에선 체크할 수 없는 장비들이 많기 때문에, 독타님이 직접 체크하시는게 나을듯 합니다
왼쪽에서 index rate는 Mangio-rvc 추론할때 쓰는 그 index rate랑 같은겁니다
높을수록 쿠세가 강해지기 때문에 적절하게 조절해주시면 됩니다
알고리즘은 rmvpe를 선택해 줍니다
노이즈 리덕션은 제 환경에서는 안누르면 소리가 아예 들리지 않습니다
독타님은 안눌러도 괜찮겠죠...?
체크 안하면 딜레이가 더욱 줄어들게됩니다
그다음 start audio conversion을 누르면, 약 2~3초의 로딩 후
입력된 사운드가 고른 모델의 목소리로 변조되어 나가게 됩니다
제 컴퓨터 기준으로는 input과 output의 딜레이가 약 100ms정도 생깁니다
보통 투컴의 경우 이보다 더 짧아지는것으로 알고 있습니다
혹시 성별을 전환한다면, 인덱스 위의 pitch settings를 +12 (남목으로 여자 모델) -12 (여목으로 남자 모델) 로 조절하면 됩니다
설정값 변환이 실시간으로 적용되진 않기 때문에, 설정값을 바꿨으면 반드시 stop 후 다시 start를 눌러야 합니다
원리는 이런식으로 짧은 시간동안 추론을 반복하고 출력하는 형식입니다
예시 음성을 보여드리기엔 제가 녹음 환경이 안좋아서
(마이크가 없어 노트북 마이크를 쓰는데 노트북 팬소리와 하울링이 계속 들어갑니다 ㅠ)
환경이 되면 나중에 예시 녹음영상같은거 올려보도록 하겠습니다