Input
음성을 글로
Whisper 또는 Qwen3-ASR vLLM 서버를 통해 한국어/영어 발화를 텍스트로 옮기고, 응답 언어를 자동으로 라우팅합니다.
- Provider
- -
- ASR language
- -
- Response language
- -
Turn taking
말 시작과 끊김 감지
RMS 에너지 기반 검출과 다단계 barge-in 게이트로 잡음에 의한 오탐을 줄입니다.
- Provider
- -
- Threshold
- -
- Min speech
- -
Output
음성으로 답하기
기본값은 별도 vLLM-Omni 서버의 Qwen3-TTS WebSocket 스트리밍입니다. 브라우저에는 raw PCM을 그대로 중계합니다.
- Provider
- -
- Voice
- -
- Sample rate
- -
Kokoro 82M
provider=kokoro