
软件简介:
AI语音识别转文字工具stt是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口。
使用说明:
部署或下载后,双击 start.exe 自动调用本地浏览器打开本地网页。
拖拽或点击选择要识别的音频视频文件,然后选择发声语言、输出文字格式、所用模型(已内置base模型),点击开始识别,识别完成后以所选格式输出在当前网页。
全过程无需联网,完全本地运行,可部署于内网
其实在很久以前我就有分享过几款制作视频字幕的工具,但是由于有些配置有点复杂,有些又需要N卡来运行,各种原因都没有怎么受大伙的欢迎
今天分享的这款 效果也不错,速度也不错。我亲测了几个视频,处理起来速度还不错,错别字也不算多,目前我还没有遇到语音转文字几乎没错的工具,可能是普通话标准与否这些都有很大的关系。所以完美的暂时没有见过。
这个工具操作也是极其简单,所有操作都是在本地进行,不用担心泄露什么。先把视频文件或者语音文件拖进来。然后选好语音,选好模型。点立即识别等待几十秒后就可以在下面的框框里看到识别后的文字。字幕是带有时间戳的,把txt文件的后缀改成.srt,直接拖到视频剪辑软件里面就可以了。
为了方便小伙伴们的使用,我已经把所有的模型都放在压缩包里了,省得你们再去找模型了。
下面说下这些模型我的使用心得。
base 处理速度最快,但是效果也是最差
small 和base差不多
我觉想准确率高点的话 至少要用medium。但是用medium有个bug,就是生成文字里面有繁体中文。解决也很简单用繁体转简体工具转换一下就好了
large-v2和v3 这2个模型效果是最好的,但是处理时间也是最长的。
所以小伙伴可以根据自行的需求来试试各个模型。
下载地址:https://pan.quark.cn/s/56398ac7d909
备用地址:https://pan.baidu.com/s/1HwpkPw30ik2HtRTrdhS7Gw?pwd=3br4 密码:3br4

木风软件站










最新评论
怎么激活
下载后此管家直接被企业管家杀了
资源猫安装到电视上,打开弹出软件使用声明,需要同意仅用于学习交流,然而在电视上选择不了同意、交流学习、不同意这几个选项,而且这个弹窗没办法退出,只能关闭电视电源。试了几次都是这样,用不了。怀疑是手机版的,和电视不兼容,需要设置,但是有这个弹窗在,既选择不了,又退不了
阿木。可不可以直接蓝奏网盘。夸克和百度下载一个不到10MB的软件就要先下载他们几百MB的客户端注册然后几KB的下载速度。我服了。
这款应用可能是失效了,试试这款新的短剧app:https://www.mfrjz.com/soft/jiduanju.html
没法用,加载不出来,也没有地方选择源。
好的,文章已添加截图说明
好用!