[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]请问批处理如何提取网页部分内容?

本帖最后由 Bear_Cid 于 2024-5-13 14:09 编辑

操作系统为Windows 10 企业版

因为需要对大量标准定期进行查新,故希望可以批量提取标准的最新版本名称,以便进行更新。
以ASTM D1512为例:
查询该标准的网址为:https://www.astm.org/catalogsearch/result/?q=D1512
如何将图中红框部分提取至txt或以其它文本方式保存?
[img][/img]

谢谢
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

本帖最后由 aloha20200628 于 2024-5-13 11:26 编辑

回复 1# Bear_Cid

假设楼主已经用 https://www.astm.org/catalogsearch/result/?q=D1512 下载好对应的网页文件 D1512.html,用以下批处理代码(存为test.bat运行)即可将网页文件中的 D1512-23 截取到文件 D1512.txt
  1. @echo off
  2. for /f tokens^=2^delims^=^" %%a in (' findstr /ic:^"data-product-sku^=\^"D1512-^" "D1512.html" ') do set "v=%%a"
  3. echo,%v%>"D1512.txt"
  4. pause&exit/b
复制代码
1

评分人数

TOP

回复 2# aloha20200628


    感谢回答,但按照上述流程操作后,txt文件中并无任何数据,目前同学使用其它工具解决了本主题的问题,但还是感谢提供回复以及帮助的您。

TOP

本帖最后由 aloha20200628 于 2024-5-13 11:26 编辑

回复 3# Bear_Cid

抱歉复制代码时漏了一个^转义符,一字之差云泥之别
2楼代码已订正,测试成功...

TOP

返回列表