Whisper Large

OpenAI 开源的通用语音识别模型，支持多语言语音识别、翻译和语言识别。

发布方：OpenAI发布日期：2022年12月6日类别：语音识别

语音识别多语言

Whisper Large 是 OpenAI 开源的通用语音识别模型，支持多语言语音识别、翻译和语言识别。

核心特性

Whisper Large 在多种语言的语音识别任务上达到了接近人类水平的准确率，特别是在英语语音识别上表现尤为突出。

import whisper

model = whisper.load_model("large")
result = model.transcribe("audio.mp3")
print(result["text"])