[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]批处理如何提取文本中列出的多个网址中的顶级域名和二级域名

小弟弄了个批处理是提取顶级域名和二级域名的数据   现在想加个过滤机制  /域名级数多余3级的去掉      域名中有?号动态网址的去掉   剩余的数据 二级域名 顶级域名  和一些内页提取出来  注意这个批处理要把WWW.去掉才能提取的准确  我一般是手动替换  但是数据大也是麻烦 如果可以 麻烦修改的大大 顺便把在提取数据前  自动替换掉WWW.的功能加进去 感激不尽

先帮你删除www.
  1. sed "s/www\.//" "louboutin pumps.txt" > "louboutin pumps_new.txt"
复制代码

TOP

回复 2# BAT-VBS


    先谢过大侠。。

TOP

我用来去www的 你看下
  1. @set topdomain=%u:www.=%
复制代码
这个是我用来去读文件行,然后生成的不同后缀的,可以借鉴使用
  1. for /f "delims=" %%i in (mb.txt) do (if not defined %%i set %%i=A & echo %%i>>tmp.tmp)
  2. for /f %%i in ('type tmp.tmp') do (@echo ^/^%%i%%t>>cgi.list)
复制代码

TOP

返回列表