OpenAI 开源的通用语音识别模型,支持多语言语音识别、翻译和语言识别。
Whisper Large 是 OpenAI 开源的通用语音识别模型,支持多语言语音识别、翻译和语言识别。
Whisper Large 在多种语言的语音识别任务上达到了接近人类水平的准确率,特别是在英语语音识别上表现尤为突出。
import whisper
model = whisper.load_model("large")
result = model.transcribe("audio.mp3")
print(result["text"])