Board logo

标题: [其他] 批处理 提取网页代码某段内容 [打印本页]

作者: aipca    时间: 2015-1-23 17:03     标题: 批处理 提取网页代码某段内容

href="javascript:void(0);" onclick="fnServerDuelRoleFight( 25409 );">1111111</a>
href="javascript:void(0);" onclick="fnServerDuelRoleFight( 528810 );">1111111</a>
href="javascript:void(0);" onclick="fnServerDuelRoleFight( 553590 );">1111111</a>

某网页里面 有类似于上面的代码 我要用批处理提取出“fnServerDuelRoleFight( 553590 )” 红色字部份 并把每个数字保存到一个文档里面去
一个网页里面 有十五条这样的代码,也就要提取出15个数字 分别把这个15个数值保存到15个文本文件里面去 数值是随机的不是固定的。

请问这个批处理要怎么写?
作者: aipca    时间: 2015-1-23 17:09

因为这个网页需要登陆才能进入 所以我就不发出来了 就假设URL为http://www.bathome.net/thread-33993-1-1.html
作者: Batcher    时间: 2015-1-23 17:13

  1. @echo off
  2. setlocal enabledelayedexpansion
  3. set file=1
  4. for /f "tokens=4 delims=()" %%i in (a.txt) do (
  5.     set num=%%i
  6.     set num=!num: =!
  7.     >!file!.txt echo,!num!
  8.     set /a file+=1
  9. )
复制代码

作者: aipca    时间: 2015-1-23 17:23

回复 3# Batcher


    不是本地文件啊 是在线的URL代码中的一段
作者: Batcher    时间: 2015-1-23 17:24

回复 4# aipca


    没有真实的URL无法测试,瞎编的URL是不行的,因为要根据实际的网页内容写代码。
作者: CrLf    时间: 2015-1-23 20:28

本帖最后由 CrLf 于 2015-1-23 20:31 编辑

楼主描述太含糊,懒得去考虑登录以及各种特殊情况,用这个 hta 自行登录到需要的页面,按下顶部红色区域开始获取
具体文件什么的自行修改第三行
  1. <button
  2. style='background-color:red;color:white;width:100%'
  3. onclick='get_fnServerDuelRoleFight("生成的文件.txt")'
  4. >
  5. 我准备好了,点击获取 fnServerDuelRoleFight 列表
  6. </button>
  7. <br />
  8. <script>
  9. function get_fnServerDuelRoleFight(filePath){
  10. var fso = new ActiveXObject('Scripting.FileSystemObject')
  11. var ts = fso.CreateTextFile(filePath,true)
  12. var innerHTML = document.getElementById('fnServerDuelRoleFight')
  13. .contentWindow.document.body.innerHTML
  14. var arr = []
  15. var re = /fnServerDuelRoleFight\(\s+(\d+)\s+\)/g
  16. var exec
  17. while(exec = re.exec(innerHTML)){
  18. arr.push(exec[1])
  19. }
  20. ts.WriteLine(arr.join('\r\n'))
  21. alert('Bingo!')
  22. window.close()
  23. }
  24. </script>
  25. <iframe
  26. id='fnServerDuelRoleFight'
  27. style='width:100%;height:100%'
  28. src='http://www.bathome.net/thread-33993-1-1.html'
  29. />
复制代码

作者: aipca    时间: 2015-1-24 10:52

回复 6# CrLf


    哇咔咔 果然可以 谢谢 这个HTA可以直接用批处理调用么?
作者: aipca    时间: 2015-1-24 11:13

回复 6# CrLf


    我准备好了,点击获取 fnServerDuelRoleFight 列表

这个提交按扭能不能改成自动提交的?而不需要手动点击




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2