字幕生成V2.3 : 英文单词的兼容,batch_size的自定义.
关于安装:
链接:https://pan.baidu.com/s/1u5NZLB_JItQp3umyLytRoQ?pwd=zph7
提取码:zph7
你需要将V2_DLC内文件替换到根目录。
值得注意的是,这一次的第0个修改还在测试阶段。
如果你的转录需要涉及英文,可以进行测试,可以替换V2_DLC_dev的部分。
0.英文单词被拆开,字母被当成单词
问题描述:
主要是因为text_seg中把英文单词拆成了字母,但是ts_list却是一个单词一个time_stamp。
在用str[index]读取的时候,只会把字母单独读取进来而不是以单词的形式读取。
就会出现很多的单字母成单词的现象。

image-20240730201136116
修改前:

image-20240730211926982
修改后:

image-20240730212003959
1.如果异常,不退出,继续执行。

Image
有些音频可能异常,会引起异常退出,中断执行。而我没有写断点继续,对于批量转换来说是个噩梦。

image-20240730200715288
目前暂时会先跳过异常部分,并且在最终打印有哪些音频因为异常未能转换。至少不会异常退出了。
2.将batch_size_s改成可以修改的值。

image-20240730200826589
你可以修改它batch_size_s。 但这个项目其实不必担心显存问题,cpu跑的也不算太慢。