IdxSubOcr是一款字幕格式识别转换软件,可以识别英文和中文,自带的OCR引擎识别率非常高,可以对识别的文本进行替换,字符编码转换,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能,是一款非常不错的免费的字幕OCR软件。
工具使用:
1、点击“打开idx文件”按钮,选择需要OCR/校对的idx文件。 或直接从资源管理器拖拽idx文件。
2、如果有必要,设置“毫秒分隔符”选项,即毫秒用小数点还是句号分隔。
3、如果有必要,勾选“OCR前先加粗处理”,避免因为笔画过细影响OCR质量。但如果文字笔画本来就不细,勾选此选项后可能造成笔画粘连,反而影响质量。
4、在“操作选项”里,选择需要OCR/校对的字幕,及究竟是要OCR还是校对。
5、如果是OCR,在接下来的“OCR”选项中,需要选择OCR语言及字幕颜色。注意这两个选项直接关系到OCR效果,所以必须认真选择:语言好说,颜色必须保证文字为实心字,空心字没法识别。 如果6、字幕第一行为空,则文字颜色可能不能选择,可以选择字幕其他行,直到能够选择颜色。OCR识别结束后,自动进入校对模式。
7、如果是校对,界面上方显示字幕图像,下方显示文字,用户可以直接对文字进行编辑。在编辑框中可以使用上下箭头、PgDn、PgUp滚动。校对完成后,点击“保存srt文件”按钮存盘。
校对辅助功能:
1、文本替换。通常用来替换OCR中的一些习惯性错误。
2、英文句首字母大写。某些英文字幕全是大写,看起来比较费劲,用这个可以转成小写。
3、繁体转简体。繁体中文字幕OCR后的结果是GBK编码的繁体字,如果觉得麻烦,可以用这个功能转换成GB编码的简体字。
4、另外如果想改变已有srt文件中的毫秒分隔符,可以选择“校对”,然后刚刚“毫秒分隔符”选项,再存盘即可。
相关说明:
字幕OCR有其特殊性:
1、字幕中的文字通常都很小,其实Vobsub显示的时候都是放大显示,所以才会看到锯齿。
2、目前商用的OCR引擎,主要针对的是扫描文字,字体尺寸要比字幕的字体尺寸大很多,如果直接使用这样的OCR引擎,识别率很难提升。
影响OCR识别率的因素有哪些?
1、OCR语言选择错误。
2、字幕图像质量太烂。如果是笔画太细,可以试试看勾选“OCR前先加粗处理”。
3、中英文混杂,这个没有办法,是OCR引擎的事情。
4、文字出现斜体或其他花狸狐哨的变体,这个也没有办法,同样是OCR引擎的事情。