字幕生成V2.2:Bug Fix,支持手动修改device,独立保存带标点完整文本
字幕生成V2.2:Bug Fix,支持手动修改device,独立保存带标点完整文本
这次更新只更改了代码部分,网盘直接覆盖V2_DLC到根目录即可。
网盘链接:
https://pan.baidu.com/s/17N9V91jBFwqBgWW_9PbXBw?pwd=kw5b
DLC已经更新,欢迎报告bug。
github:
1.List out of index:(究极Boss,终于被我逮到了)
今天使用的时候也恰好碰到这个bug了,就修了一下。

list_index_out_of_range
如果你们碰到应该怎么做:
先将time_stamp.py中write_long_txt的debug设置成=True,默认时=False。

再碰到怎么做
然后把这个截图发给我。

Snipaste_2024-07-07_07-44-53
可以看到检测到了597个字符单元(一个汉字或者一个单词),但是时间序列长度只有591,所以会报错。
这一次的原因是:you'll,can't,she'd,因为我的代码会被拆分成you ll, can t , she d。而把所有英文单词缩写都当成了两个单词,我修改了一些判断逻辑,把缩写当成一个单词就没再报错。
当你碰到识别到一些奇怪的符号的时候,加到config.yml的标点list中就可以。

Snipaste_2024-07-07_07-45-45
最终确保识别到的word和时间序列长度一样即可。

确保长度一样长,就不会报错。
2.通过Config更改device。
cpu写cpu,用显卡则写cuda,只支持NVIDIA的显卡。

cuda
3.在写入srt字幕文件的时候顺便写入only_text的文件。
有人提到会用这种来进行一个视频转文档,所以就顺便写了,不会额外增加识别时长。

Snipaste_2024-07-07_10-14-35