Board logo

标题: [文本处理] [已解决]批处理提取文本中特定部分 [打印本页]

作者: lantern    时间: 2014-10-5 05:53     标题: [已解决]批处理提取文本中特定部分

本帖最后由 lantern 于 2014-10-5 09:57 编辑

在用tor翻墙,需要经常找网桥,从网站上获取的数据需要处理成Bridge 93.174.90.30:9001这种格式:
数据保存在ddd.txt中,里面有空格、TAB等就不贴了,见https://cnlic.com/wp-content/uploads/2014/10/ddd.txt
现在在分几步走:
1、提取含有"["的行
  1. @echo off
  2. findstr [ ddd.txt >dddd.txt
复制代码
2、记事本打开dddd.txt,把"]        Disputed Server        "替换为":"保存
3、以[为分隔符,提取第二列,得到需要的数据ddddd.txt,见https://cnlic.com/wp-content/uploads/2014/10/ddddd.txt
  1. @echo off
  2. for /f "tokens=2 delims=[" %%a in (dddd.txt) do (
  3. for %%A in (%%a) do echo Bridge %%A>>ddddd.txt
  4. )
复制代码
请问怎么才能一步到位,谢谢
作者: bailong360    时间: 2014-10-5 09:20

  1. @Echo Off
  2. SetLocal EnableDelayedExpansion
  3. For /F "Delims=[ Tokens=2*" %%i In ('Findstr [ test.txt') Do (
  4. Set Str=%%i
  5. Echo Bridge !Str:] Disputed Server =:! >>Bridge.txt
  6. )
复制代码
实测有效
作者: lantern    时间: 2014-10-5 09:48

回复 2# bailong360
谢谢!试了一下貌似不对啊,Bridge.txt输出是这样的
  1. Bridge 93.174.90.30] Disputed Server 9001
  2. Bridge 62.210.136.51] Disputed Server 9001
  3. Bridge 62.210.82.44] Disputed Server 21
  4. Bridge 197.231.221.211] Disputed Server 8080
  5. Bridge 94.242.246.24] Disputed Server 8080
  6. Bridge 96.47.226.20] Disputed Server 443
  7. Bridge 194.150.168.95] Disputed Server 443
  8. Bridge 37.130.227.133] Disputed Server 443
复制代码

作者: apang    时间: 2014-10-5 09:53

回复 3# lantern

把Disputed Server前后的空格换成Tab字符
作者: bailong360    时间: 2014-10-5 09:55

回复 3# lantern


    如4楼所说
作者: lantern    时间: 2014-10-5 09:56

回复 4# apang
ok了,多谢二位!




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2