Coggle专业的数据科学、大模型和数据竞赛社区
首页竞赛博客教程模型应用
首页竞赛博客教程模型应用常见链接在线工具

内容

  • 竞赛
  • 博客
  • 教程
  • 模型

资源

  • 常见链接
  • 工具
  • 应用

关于

  • 关于 Coggle
  • 隐私政策

© 2026 Coggle Community. All rights reserved.

  1. 模型库
  2. Whisper Large

Whisper Large

OpenAI 开源的通用语音识别模型,支持多语言语音识别、翻译和语言识别。

发布方:OpenAI发布日期:2022年12月6日类别:语音识别
语音识别多语言
论文代码仓库

Whisper Large 是 OpenAI 开源的通用语音识别模型,支持多语言语音识别、翻译和语言识别。

核心特性

  • 多语言支持:支持 99+ 种语言的语音识别
  • 多任务:支持语音识别、翻译(X→EN)、语言识别
  • 弱监督训练:在 68 万小时多语言弱监督数据上训练

性能表现

Whisper Large 在多种语言的语音识别任务上达到了接近人类水平的准确率,特别是在英语语音识别上表现尤为突出。

使用方式

import whisper

model = whisper.load_model("large")
result = model.transcribe("audio.mp3")
print(result["text"])