Board logo

标题: [文本处理] 求助批处理怎么提取txt文件中的图片下载地址? [打印本页]

作者: zhajige    时间: 2018-5-8 11:08     标题: 求助批处理怎么提取txt文件中的图片下载地址?

把网页源文件保存为txt文件,想把里面http开头到jpg结尾的全部信息提取并导出到txt中,请问要怎么实现呢?
  1. @echo off
  2. (for /f "delims=" %%a in (a.txt) do (
  3.   for %%b in (%%a) do (
  4.     for /f delims^="" %%c in ("%%b") do if /i %%~xc==.jpg echo %%c
  5.   )
  6. ))>b.txt
  7. pause
复制代码
用这个操作不了啊,把txt改成html也是不行
跪求大神帮助,好人一生平安,感激
作者: 见与不见    时间: 2018-5-8 11:29

http://bbs.bathome.net/viewthrea ... mp;highlight=repdos
没有匹配网页图片的代码
作者: Batcher    时间: 2018-5-8 11:44

把你的html文件压缩之后传上来,我试试。
作者: zhajige    时间: 2018-5-8 12:04

回复 3# Batcher

我也是随便拿一个html试的  我是拿淘宝链接的源文件试的
作者: yhcfsr    时间: 2018-5-8 13:33

这个有难度,我试了淘宝主页,导出个不完全处理的文本,发现最后一行的结果包含多个图片,且并不是以http开头。
所以,必须要研究所处理网站的代码规律,如果只是随便,只怕结果不尽人意。
作者: web    时间: 2018-5-13 09:14

本帖最后由 web 于 2018-5-13 09:52 编辑

findstr /v
findstr
或者其他命令
筛选一下符合的内容之后可以用for在截取

不会高级的用简单的办法

for /f "tokens=1-6 delims=="

一行多个连接先全部分行在截取




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2