佛系程序员
首页
栏目
标签
归档
关于
友链
佛系程序员
首页
栏目
标签
归档
友链
关于
字幕文件制作方法
chatGPT
技术开发
发布日期: 2024-05-06 03:58:20
喜欢量: 32 个
阅读次数:
701
分享两个制作字幕文件的方法
<p>以法师讲经3小时多的视频为例,本文讲解对于超长视频如何制作出字幕文件。</p><p><br></p><p>素材取得,直接从youtube通过第三方网站https://www.youtubezz.com/下载到mp3文件。</p><p>方法一:用剪映软件</p><p>采用的是声音转文字的方法,将音频分为约30分钟一段,进行处理比较合适。</p><p>1. 媒体-导入素材,2.拖到处理框 3. 文字-智能字幕-识别字幕(先不要点,等会儿主要用这个)</p><p>4. 在处理区域,用剪刀在约30分钟剪一刀,删去后面的,留下最前面的30分钟,点识别字幕,大约5分钟,生成,导出字幕srt,txt, w29-1.srt。再回到处理区域,点撤回两步,使得留下音频,仍然是全部,再到约1小时位置剪一刀,再删去后面的,及前面已经做好的30分钟,即留下第2个30分钟,再点识别字幕,大约5分钟,生成,导出字幕srt,txt,w29-2.srt。以此类推。每一个字幕都将带有正确的时间。这样生成的6或7个文字再拼接,成为一个大文件w29.srt。</p><p>再对w29.srt进行手工的校对。</p><p><br></p><p>方法二:用图形提取文字用到两个软件,具体如下。</p><p>因为法师讲经视频已经有硬字幕,那么就可以采用这个办法,需下载清晰度高的视频720p.</p><p>但是采用这个办法对电脑需较高配置,查看软件来源处的说明。</p><p>使用vse_windows_cpu_v2.0.0提取,视频中字幕,</p><p>软件来源:https://github.com/YaoFANGUK/video-subtitle-extractor</p><p>方法:</p><p>1. 下载程序到电脑中,并解压</p><p> 目录如:E:\yiyi\vse_windows_cpu_v2.0.0\</p><p>2.进入目录,双击vse\gui.exe</p><p>3.软件打开了,打开视频文件29.mp4(保存在电脑中的视频文件取英文或数字名称,不要取中文不要有空格)</p><p>4.进入设置,识别字幕语言,选繁体中文。</p><p>4.点运行</p><p>5.运行过程中,可以点开目录 vse\output,查看,会出现视频名称的目录,</p><p>6.进入目录,RGBImages是生成的字幕条,一张张图片,这个成功生成了。(半)</p><p>7.查看字幕文件夹subtitle中:</p><p>raw_vsf.srt 完成了,带时间轴,</p><p>raw.txt 没有生成出来。</p><p>回到软件看,进度到一半卡住了。(这个就出问题了)</p><p><br></p><p>使用Umi-OCR批量图片提取文字</p><p>https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.1</p><p>下载,解压,运行,添加全部字幕条图片,设置语言为繁体。</p><p>指定目录输出。</p><p>点开始运行。速度,需要10分钟处理完5251。</p><p>生成字幕文件:[OCR]_RGBImages_20240504_2031.txt(这个文件是一行时间段,一行字幕文字的,后面要手工核对)</p><p>再结合前面生成的raw_vsf.srt</p><p>就可以组成一个字幕文件了。</p><p>但是这样生成的时间轴是根据硬字幕变化的,与根据声音生成的有不同。<br>然后去掉时间段的这一行格式为(≦ 0_00_15_315__0_00_18_550_0062100144010010072001280.jpeg ≧),只留下文字,使用python处理,handlesub.py, <span style="color: rgb(220, 220, 170); background-color: rgb(31, 31, 31); font-family: Consolas, "Courier New", monospace; white-space: pre;">remove_blank_lines.py</span></p><p>得到纯文字后,一行一行的。再用chatGPT.组合成文章,结合语义,加标点符号.</p><p><br></p><p>第一种方法,不需要程序技术,一般都可以用。</p><p>第二种方法,需要程序技术,因为生成的字幕,与视频中的硬字幕分行一致。但在遇到法师有板书时,会把板书也加进来,字幕就会比较不准确。</p><p><br></p><p><br></p><p>把第二种方法,核对后,先生成字幕txt文件,再到剪映处理一次,20分钟一段,进行文稿匹配的方法,再去生成带时间段的。这个处理也比较长时间。</p><p><br></p><p>总体来说,第二种方法好一些。</p><p><br>个人经验,处理28集大约花了7倍的时间,处理29集花了4倍的时间。</p><div>现在这个29集是,第二种方法处理的。<br>制作字幕是一件蛮辛苦的工作,最好多人合作,一人校对一部分就可。<br>很感恩之前的课程文稿,师兄们辛苦的付出。</div>
文章作者:
yyii
文章链接:
https://amtb.info/show/NTQ=
版权声明:
本博客所有文章除特別声明外,转载请注明来源
佛系程序员
!
分享:
搜索