Video-subtitle-extractor (vse)视频硬字幕提取为外挂字幕文件(srt格式)工具
视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。
Video-subtitle-extractor (vse) 是一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件。 主要实现了以下功能:
- 提取视频中的关键帧
- 检测视频帧中文本的所在位置
- 识别视频帧中文本的内容
- 过滤非字幕区域的文本,去除水印(台标)文本
- 去除重复字幕行,生成srt字幕文件
- 支持视频字幕批量提取
- 多语言:支持中文/英文、日语、韩语、繁体中文、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取
- 多模式:
- 快速 – 快速提取字幕但可能丢字幕(推荐)
- 精准 – 不丢字幕但速度较慢
使用说明:
- 视频以及程序路径请不要带中文和空格,否则可能出现未知错误!!!
如:以下存放视频和代码的路径都不行
D:下载vse运行程序.exe(路径含中文)
E:studykaoyansanshang youya.mp4 (路径含空格)
- 直接下载压缩包解压运行,如果不能运行再按照下面的教程,尝试源码安装conda环境运行
下载地址:
- Windows 单文件版本(双击直接运行,每次打开时会有一点慢,推荐小白使用): vse.exe
- Windows GPU版本: vse_windows_GPU.7z
- Windows CPU版本: vse_windows_CPU.zip
- MacOS CPU版本: vse_macOS_CPU.dmg
PS: 若无法下载,请前往 Release 下载
项目特色
- 采用本地进行OCR识别,无需设置调用任何API,不需要接入百度、阿里等在线OCR服务即可本地完成文本识别
- 支持GPU加速,GPU加速后可以获得更高的准确率与更快的提取速度
- (CLI版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
- (GUI版本) 图形化界面
演示
- GUI版:
由于动图文件太大了,就不放上来了,想看的请打开源项目仓库查看:
https://github.com/YaoFANGUK/video-subtitle-extractor
类似功能的软件:
与vse不同的是,它不是根据视频硬字幕来识别,而是通过视频语音转字幕,两者功能互补,搭配使用非常强大;