程序使用语音到文本自动生成字幕?

我有一个video,我想为其创建字幕。 是否有一个程序可以执行基本的语音到文本

  1. 设置每个字幕的正确开始/停止
  2. 创建基本的文本字幕(使用某种语音到文本)

我知道gnome-subtitles。 但是,需要花费大量精力手动创建这些字幕。 你需要自己选择每个句子的开始和结束。

Youtube具有上述function(使用语音到文本在正确的时间创建基本文本字幕)。 但是我不想将video上传到Youtube只是为了获取我的字幕。 是否可以在Ubuntu中有效地完成字幕?

更新 :我打算只使用.srt字幕,而不需要在video上硬编码。 我最大的要求是让程序自动找到每个句子的开始/停止,以便我在其中写入文本。

更新#2 :有适用于Linux的Speech-to-Text软件,带有CMU Sphinx软件包。 根据http://sourceforge.net/projects/cmusphinx/forums/forum/5471/topic/3949891 ,可以将CMU Sphinx与字幕程序一起使用。此外,一个字幕工具可以识别这个CMU Sphinxfunction, http: //groups.google.com/group/universal-subtitles-testing/browse_thread/thread/613361ffb921b43b (基于网络的工具),但最新源代码中没有提及他们添加了CMU Sphinx。 任务继续找到一个程序,使用CMU Sphinx进行基本语音到文本(也可以设置正确的时间),就像Youtube已经做到的那样。

几年前我在Windows上使用过Aegisub ,并且非常满意。 显然它适用于Linux。 这是非常自我解释。

Aegisub仅创建字幕文件,例如.srt文件。 要组合video和字幕以创建硬编码的字幕,您仍然需要使用第二个程序。
在Windows上我使用VirtualDub,但它不适用于Linux。 您可以在维基百科上找到合适的程序。

还有其他字幕编辑

更新:
我不记得Aegisub具有自动设置字幕文件中口语句子的开头和结尾的function。 我在网站的任何地方都没有看到这样的function。 然而,使用(键组合)手动设置这些时间非常容易。

有没有任何具有这种function的程序(在任何操作系统中)?

通过分析video中的声音,我找不到让字幕程序自动添加基本字幕的方法。

因此,我使用的替代方案是

  1. 将video上传到Youtube(例如,私下)并使用in-build工具自动创建基本字幕。

然后,

  1. 将video添加到http://www.universalsubtitles.org/并手动创建每个句子的时间范围,如果Youtube中的自动方式不起作用,或者句子正在消失。
  2. 使用GNOME字幕 (在软件中心中找到)以清理字幕并修复任何时间。

我个人喜欢Gnome Subtitles,它可以在存储库中找到。

sudo apt-get install gnome-subtitles 

好的,找到了一些看起来不错的工具,类似于字幕工作室 – 字幕编辑器(apt-get install subtitleeditor)。

试图将它与Gnome Subtitles进行比较,字幕编辑器看起来更加先进。

对于KDE,一个好的字幕编辑器是subtitlecomposer。 使用命令安装它

 sudo apt-get install subtitlecomposer 

或使用链接subtitlecomposer 安装subtitlecomposer