将DJVU转换为PDF

我想将DJVU文档转换为PDF文档，分离并保留文本层和图像，同时保持 DJVU 的结构 。我怎么能在Ubuntu中这样做？

（然后我将使用Calibre转换为ePub / Mobi，所以如果有一个Calibre插件用于整个过程，对我来说是完美的！）

注意1：从Evince打印，从DJview导出或使用包ddjvu的任何内容都不是适当的解决方案，因为它们丢弃文本层，只保存图像。

注意2：使用DJVULibre似乎只提取文本图层而不提取图片。 类似地，“手动”复制文本会丢失文档结构和图片。

方法1

只需使用DJView并导出为PDF

转到Synaptic包管理器
安装DJview4
运行DJview（应用程序 – 图形 – DJView4）
打开.djvu文档
：菜单 – 导出为：PDF

方法2

在evince中打开djvu文件
选择打印—->打印到文件
将.ps更改为.pdf并单击打印

方法3

转到Synaptic包管理器
安装

djvulibre-bin libdjvulibre21 okular-extra-backends evince libevdocument3 libevview3
转到终端并写
```
  sudo apt-get install libtiff-tools 
```
转到djvu文件所在的目录。单击鼠标右键。转到“打开终端”选项。点击它。终端将开放。

在那个终端写

 ddjvu -format=tiff file_name.djvu file_name.tiff tiff2pdf -j -o file_name.pdf file_name.tiff

方法4

还有一个在线转换器DjVu到PDF转换器

这是一种方法，需要一些不常见的工具：

ocrodjvu
pdfbeads ，它有自己的要求，可以在谷歌找到

我们可以使用djvu2hocr命令（来自ocrodjvu包）从DjVu文件中提取隐藏文本层（它不执行任何OCR或类似操作，它只提取具有几何的文本层），即：

djvu2hocr -p 10 sample.djvu | sed 's/ocrx/ocr/g' > pg10.html

sed干预纠正输出hOCR中的类名（这只是简单的HTML文件）

现在我们将DjVu页面提取为TIFF格式：

ddjvu -format=tiff -page=10 sample.djvu pg10.tif

所以我们在out工作文件夹中以这些文件结束：

 sample.djvu pg10.html pg10.tif

这就是pdfbeads用武之地，我们简单地执行：

pdfbeads -o pg10.pdf

然后这个漂亮的程序负责处理此文件夹中的所有内容（具有相同基本名称的HTML和TIFF文件），并生成带有一些副产品的输出PDF文件：

 sample.djvu pg10.html pg10.tif pg10.jbig2 pg10.pdf pg10.sym

这与输入DjVu文件相同，内部有文本层：

在此处输入图像描述

评论摘要：

下面的冗长评论讨论将来自DjVu文档页面的较小图像表示为单独的对象，这是不容易实现的，因为DjVu文档页面本身只是具有可选文本层的单个图像，没有关于较小图像作为单独对象的“信息”。如果DjVu文档有彩色图像，那么它们通常会放在背景图层上; 在这种情况下，用户可以利用ddjvu （仅提取背景图层）和imagemagick （自动裁剪）等工具来输出图像而不是整个canvas，但无法自动创建PDF输出

另一种更为理智但速度较慢的方法是使用常规OCR GUI工具。建议将gscan2pdf （> 1.0）作为Linux PC的候选者

使用DJVULibre ，可以通过terminal命令提取文本层：

djvutxt myfile.djvu > myfile-ocr.txt或djvused myfile.djvu -e 'print-pure-txt' > myfile.txt

（两者都做同样的事情，并在这里找到）

格式化需要一些努力（因为许多符号未正确转换）并且图片无法恢复 。

有djvu2pdf，但它依赖于ghostscript，所以它可能是另一个打印选项。我仍然建议你试一试，以防万一它比我给它的功劳更聪明。

这不是在回购，但你可以从制造商的网站下载deb：http： //0x2a.at/s/projects/djvu2pdf

**在此处插入关于从回购外部下载/安装东西的强制性通知**

最简单的方法：使用gscan2pdf导入djvu，然后使用tesseract对其进行OCR，最后将其另存为pdf。 pdf中的OCR文本可能与原始djvu略有不同，转换可能需要一段时间，但这种方法很简单并且可行。

http://www.djvu-pdf.com/ – 使用此网站，您可以将djvu转换为pdf。

将DJVU转换为PDF

方法1

方法2

方法3

方法4

为pdf和djvu文件添加书签

可以在应用程序退出之前记住打开的内容吗？