Tag: text

文件内的文本中包含带数字的正方形

我遇到的一些文本文件中有小数字的正方形(代替某些字符)。 我无法在Ubuntu中复制和粘贴这些内容,但可以单独搜索和替换gedit每个字符(替换为我认为最匹配的内容),显然只有少数类型的square才可行。 我会相信显示这些方块因为我缺少某些字体…我的目的是将其转换为ePub或PDF文件。 我的问题是: 这是什么类型的编码? 为什么会发生这种情况? 如果它缺少字体,我可以安装它们并解决问题(允许我将符号转换为PDF,例如使用Calibre )吗? 是否有应用程序将我的文本文件转换为没有这些方块的文本文件,而是用类似的字符替换它们? 例如,符号 几乎是一个y ,所以我希望这个函数替换每个实例 与y 。 这里有一个示例txt文件,它最初看起来像这样 (注意OCR之后的不准确)。 注意:我无法使用uni2ascii或iconv (虽然我可能没有使用正确的[options]),所以请在发布解决方案之前检查给定的文件!