OpenAI 公司最为人所知的就是 ChatGPT 人工智能聊天机器人(现在还有人不知道吗? ),其实它还有其他也是很强大的项目研究,例如「DALL· E 以描述让 AI 创造图片,也能编辑现有图片呈现逼真效果」或是另一个对语音即时识别、转为文字文件的 Whisper 技术,都是当今 AI 领域的伟大发明,对于用户来说或许不用很清楚这些技术背后的实际运作方式,只要善用对的工具就能提高工作效率。
本文要介绍「MacWhisper」是一个将录音或视频自动转为逐字稿的 Mac 应用程序,使用的正是 OpenAI 旗下的 Whisper 技术,无论是会议录音、讲座或是任何音频档都能透过 MacWhisper 快速准确地转换为文字,同时标记时间轴,也能在辨识后直接修正错误的本文段落 ,支持超过 100 种语言。
更棒的是 MacWhisper 所有辨识、转录工作都在使用者的电脑上进行,不需要让任何数据离开电脑,即使遇到隐私、敏感的数据也很适合通过 MacWhisper 进行转换,应用程序本身有免费和付费 PRO 方案,差异在于可下载的训练模型(Models)大小不一样,即使如此,免费版模型就能获得相当不错的正确性,同时也能在很短时间完成音频的识别工作。
MacWhisper 适用于 MP3、WAV、M4A、MP4 和 MOV 格式,付费后还能直接粘贴 YouTube 视频网址、直接将影音内容转为文字逐字稿,转换后可保存为 SRT、VTT、TXT、CSV、DOCX(付费后还有 HTML、PDF 和 DOTE 格式),速度上很快速、准确性很高,有需要的朋友可以试试看。
MacWhisper
https://goodsnooze.gumroad.com/l/macwhisper
值得一试的三个理由:
- 辨识与转录工作皆在使用者的电脑上进行,不需让任何资料离开电脑
- 快速准确将各种音频文件转换为文字,同时支持超过 100 种语言
- 可转换多种音频影片格式,付费后还可直接转换 YouTube 视频