자동 자막 ‐ 실시간 음성 인식 자막 오버레이 - auejin/vzzk-bot GitHub Wiki

자동 자막 기능은 스트리머의 음성을 실시간으로 인식해 방송 화면에 자막으로 표시해주는 기능입니다. 🎤

주요 기능

  • 실시간 음성 인식: 스트리머가 말하면 즉시 자막으로 변환
  • 다국어 지원: 한국어, 영어, 일본어 등 다양한 언어 인식
  • 자동 번역: 인식된 자막을 원하는 언어로 실시간 번역
  • OBS 오버레이: 방송 화면에 원문 + 번역 자막을 함께 표시

시작하기

1단계: 마이크 권한 허용

자동 자막 설정 페이지에 처음 들어가면 마이크 권한을 요청합니다.

  1. 마이크 권한 요청 버튼을 클릭합니다.
  2. 브라우저에서 마이크 접근을 허용합니다.

[!IMPORTANT] 마이크 권한을 허용하지 않으면 자동 자막 기능을 사용할 수 없습니다.

2단계: 오버레이 추가 (선택)

자막을 방송 화면에 표시하려면 OBS에 오버레이를 추가하세요.

  1. 자동 자막 설정 페이지에서 오버레이 URL을 복사합니다.
  2. OBS에서 브라우저 소스를 추가합니다.
  3. 복사한 URL을 붙여넣습니다.
  4. 권장 크기: 너비 1920px, 높이 200px

3단계: 음성 인식 시작

  1. 자동 자막 기능 활성화 토글을 켭니다.
  2. 인식 시작 버튼을 클릭합니다.
  3. 마이크에 말하면 자막이 표시됩니다!

설정 옵션

오디오 장치

설정 설명
입력 장치 음성을 인식할 마이크를 선택합니다. 기본값은 시스템 기본 마이크입니다.

[!TIP] 마이크 목록이 보이지 않으면 새로 고침 버튼을 클릭하세요.

인식 설정

설정 설명
인식 언어 인식할 언어를 선택합니다. (한국어, 영어, 일본어 등)
중간 결과 표시 말하는 도중에도 인식 중인 텍스트를 표시합니다.

번역 설정

설정 설명
자동 번역 번역 기능을 켜거나 끕니다.
번역 대상 언어 번역할 언어를 선택합니다. 아래 표에서 지원 언어를 확인하세요.

지원 번역 언어

언어 코드
English en
日本語 ja
简体中文 zh-CN
繁體中文 zh-TW
한국어 ko
ภาษาไทย th
Tiếng Việt vi
Español es
Français fr
Deutsch de

[!TIP] 번역은 음성 인식이 완료된 문장(확정된 결과)에만 적용됩니다. 말하는 도중의 중간 결과에는 번역이 표시되지 않습니다.

[!NOTE] 번역을 켜면 오버레이에 원문 아래에 번역 텍스트가 연한 파란색으로 함께 표시됩니다.

지원 브라우저

자동 자막 기능은 Web Speech API를 사용합니다. 다음 환경에서 사용 가능합니다:

  • ✅ Google Chrome
  • ✅ Microsoft Edge
  • ❌ Firefox (지원 안 됨)
  • ❌ Safari (지원 안 됨)

[!NOTE] VZZK은 Chromium 기반이므로 대부분의 경우 정상 작동합니다.

오버레이 커스터마이징

자막 오버레이의 스타일을 변경하고 싶다면, CSS를 직접 수정할 수 있습니다.

오버레이 파일 위치: src-tauri/overlay/subtitle.html

자세한 커스터마이징 방법은 방송 오버레이 문서를 참고하세요.


문제 해결

음성이 인식되지 않아요

  1. 마이크 권한이 허용되어 있는지 확인하세요.
  2. 올바른 입력 장치가 선택되어 있는지 확인하세요.
  3. 인식 시작 버튼을 눌렀는지 확인하세요.

자막이 오버레이에 표시되지 않아요

  1. OBS 브라우저 소스의 URL이 올바른지 확인하세요.
  2. VZZK이 실행 중인지 확인하세요.
  3. 자동 자막 기능이 활성화되어 있는지 확인하세요.

번역이 안 돼요

  1. 자동 번역 토글이 켜져 있는지 확인하세요.
  2. 번역 대상 언어가 인식 언어와 다른지 확인하세요. (같은 언어면 번역 결과가 동일합니다)
  3. 인터넷 연결 상태를 확인하세요. 번역에는 인터넷 연결이 필요합니다.