Tag: 文本处理

有一个路径列表，我如何过滤掉前面提到的路径的子目录？: 假设我有一个绝对路径的排序列表，就像我在这里回答的那样（为这个问题缩短和修改）： /proc /proc/sys/fs/binfmt_misc /proc/sys/fs/binfmt_misc /run /run/cgmanager/fs /run/hugepages/kvm /run/lock /run/user/1000 /run/user/1000/gvfs /tmp /home/bytecommander/ramdisk 我想要的是通过消除前面提到的路径的子目录的所有路径来减少此列表。这意味着，对于给定的输入，我想要这个输出： /proc /run /tmp /home/bytecommander/ramdisk 如何使用例如Bash， sed ， awk或任何其他常用工具在命令行中轻松完成此操作？适合一行的简短解决方案是值得赞赏的，但不是必需的。

如何让bash / zsh用脚本/别名将一些文本从“foo.foo.foo”更改为“foo foo foo”？: 我可以使用<或>或| 。也许我需要使用grep？

使用公共列合并文件: 我有两个文件，我想创建一个包含所有信息的第三个文件。档案1： a 111 b 222 c 333 d 666 e 777 文件2： 111 x1 222 x2 333 x3 444 x4 555 x5 666 x6 777 x7 888 x8 我想将它们组合如下： 111 x1 a 222 x2 b 333 x3 c 444 x4 0 555 x5 0 666 x6 d 777 x7 e 888 x8 0 注意： […]

如何重复文件内容n次？: 我正在尝试基准测试来比较处理文件的两种不同方式。我有少量输入数据，但为了获得良好的比较，我需要多次重复测试。而不是仅仅重复测试我想多次复制输入数据（例如1000），因此3行文件变为3000行，我可以运行更加充实的测试。我通过文件名传递输入数据： mycommand input-data.txt

有.txt文件的东西？: 我将文本存储为.txt，同时将其保存在Ubuntu 14.04中的Gedit中。但是在查看该文件夹之后，我已经存储了两个具有该名称的文件但是“Tilde Symbol” ‘〜’用于另一个文件并且它将被隐藏！说‘a.txt’意味着该文件夹也将包含‘~a.txt’ ，只有将它们取消隐藏才能查看为什么会这样？这是什么意思？有什么问题/错误吗？如何纠正呢？

搜索并替换包含反斜杠的图案: 我有一个文件 bla bla bla bla bla bla bla bla bla bla bla bla bla bla \newcommand{\datestamp}{20180215} bla bla bla bla bla bla bla bla bla bla bla bla bla bla 我需要搜索\newcommand{\datestamp}并想要用新模式替换附近的模式。必需的输出文件 bla bla bla bla bla bla bla bla bla bla bla bla bla bla \newcommand{\datestamp}{20180218} bla bla bla bla bla bla bla bla […]

如何使用每行打印字符限制的cat文件？: 我想cat文件，但每条线的最大长度限制。例如，我有一个10行的文件，每行有10000个字符，我想从每行打印前100个字符。有可能用猫或其他替代品吗？谢谢。

如果文件包含一组特定的字符串，我如何从文件中提取记录？: 我正在分析一个包含hifen分隔记录的文件xyz.txt 。我想基于字符串FADED:100 ， AM:FF和GG的存在来提取记录。随后，我需要将它们写入一个新文件faded100.txt 。源文件包含超过4万条记录，如下所示。 — ——– — – – – – – – – – – – – – – – — — – – rtuyss A / A去吧去去吧去吧去吧去IRE AP QQ Z. 订单xxxxxxx1 国家：201 NVDS TEMPROR EXTREME 巴士时间：TRASS：12 AIDED：12 FADED：100 UUU u UAUOOOOOOO GG YYYYYOYOOOOOOO POU ATM UNITED＃AM：FF YYYYYOYOOOOOOO POU POU […]

我需要使用sed / awk来获得所需的输出: Order:479959,60=20130624-09:45:02.046|35=D|11=884|38=723|21=1|1=30532|10=085|59=0|114=Y|56=MBT|40=1|43=Y|100=MBTX|55=/GCQ3|49=11342|54=1|8=FIX.4.4|34=388|553=2453|9=205|52=20130624-09:45:02.046| Order:24780,100=MBTX|43=Y|40=1|34=388|553=2453|52=2013062409:45:02.046|9=205|49=11342|54=1|8=FIX.4.4|55=/GCQ3|11=405|35=D|60=20130624-09:45:02.046|56=MBT|59=0|114=Y|10=085|21=1|38=470|1=30532| Order:799794,55=/GCQ3|49=11342|54=1|8=FIX.4.4|34=388|553=2453|9=205|52=2013062409:45:02.046|40=1|43=Y|100=MBTX|38=350|21=1|1=30532|10=085|59=0|114=Y|56=MBT|60=20130624-09:45:02.046|35=D|11=216| Order:72896,11=735|35=D|60=2013062409:45:02.046|56=MBT|59=0|114=Y|10=085|1=30532|38=17|21=1|100=MBTX|43=Y|40=1|553=2453|9=205|52=20130624-09:45:02.046|34=388|8=FIX.4.4|54=1|49=11342|55=/GCQ3| 我想得到38=之后的数字和11=之后的数字应该重命名为Clientid 输出应该是： – Orderid-479959 38= 723 Clientid=884 Orderid-24780 38= 470 Clientid=405 Orderid-799794 38= 350 Clientid=216 Orderid-72896 38= 17 Clientid=735 任何帮助将不胜感激。

加入两个文件，在某些列中添加值: 如何匹配另一个文件中2列的值后，如何添加另外2个值，就像VLOOKUP一样？以下示例。 file1中第6列和第7列的值与file2中的第1列和第2列匹配时，将在file1中添加第9列和第10列，其中第3列和第4列的值来自file2。 FILE1.TXT 1 1 1 1 1 5 9 1 2 2 2 2 2 7 8 2 3 3 3 3 3 7 7 3 4 4 4 4 4 8 6 4 FILE2.TXT 5 9 AB 8 6 EF 7 7 GH 7 8 CD output.txt的 1 1 1 1 1 […]