Board logo

标题: [文本处理] [已解决]怎样用批处理将网页原有格式内容复制到Word文档和txt文档? [打印本页]

作者: 867258173    时间: 2015-2-26 12:27     标题: [已解决]怎样用批处理将网页原有格式内容复制到Word文档和txt文档?

本帖最后由 867258173 于 2015-2-27 12:57 编辑

http://www.hgamecn.com/htmldata/article/2734.html
这网页,右键【复制】和【Ctrl+C】都失效,无法复制,不知能用批处理将这网页内容全复制到Word文档和txt文档吗?
作者: bailong360    时间: 2015-2-26 12:55

本帖最后由 bailong360 于 2015-2-26 12:57 编辑

又见到你了.
话说右键可以查看网页源代码,
火狐,Chrome内核的浏览器及新版IE还可以审查元素,或者运行js代码.
如果非要用批处理的话...只能想到这种办法了
  1. @Wget -O a.html http://www.hgamecn.com/htmldata/article/2734.html
  2. @HtoX32c /IP a.html
  3. @Start a.txt
复制代码
http://batch-cn.qiniudn.com/tool/wget.exe
http://batch-cn.qiniudn.com/tool/HtoX32c.exe
作者: 867258173    时间: 2015-2-26 13:04

本帖最后由 867258173 于 2015-2-26 13:13 编辑

回复 2# bailong360


    好久没见,右键源代码是能复制,但是格式都乱了,空行之类的。这网页用360浏览器右键也能【保存为文本】,但是全保存成不换行无间隔文档,害的我每次都得看网页重新每一行每一行的按回车,烦都快烦死了

【源码保存这样】
<p>究极的差距是包围这个行星——地球的现实。<br />贫富差距遍及世界各处,天然资源枯竭已久。<br />荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。<br />不管如何祈祷,也不会有人向他们伸出援助之手。</p>
<p>这是神已经消失的世界的法则。但世界上存在着代替神向他们伸出援助之手的人。<br />漂浮在天空中的雪白的天体“Caelum Urbs (カエルム・ウルブス)”。<br />被称为“天空之城”的天界。居民被称为“天人”。</p>
<p>Caelum Urbs和地上不同,应有尽有。<br />还有因为发达的医疗科学,天人之间不存在死的概念。</p>

360浏览器右键【保存为文本】
究极的差距是包围这个行星——地球的现实。 贫富差距遍及世界各处,天然资源枯竭已久。 荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。 不管如何祈祷,也不会有人向他们伸出援助之手。


而我想要的格式是

究极的差距是包围这个行星——地球的现实。
贫富差距遍及世界各处,天然资源枯竭已久。
荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。
不管如何祈祷,也不会有人向他们伸出援助之手。

这样
作者: 867258173    时间: 2015-2-26 13:26

本帖最后由 867258173 于 2015-2-26 13:30 编辑

回复 2# bailong360


     
不行,无法保存
作者: CrLf    时间: 2015-2-26 14:00

chrome 可以下一个 Enable Copy,碰到这种页面点一下就行,实测可用于 360 图书馆

chrome 应用商店下载地址:
https://chrome.google.com/websto ... nhncokdlaohlkneihio

或自行在控制台里黏贴并执行 Enable Copy 源码:
  1. (function() {
  2. var doc = document;
  3. var body = doc.body;
  4. var html = doc.documentElement;
  5. html.onselectstart = html.oncopy = html.oncut = html.onpaste = html.onkeydown = html.oncontextmenu = html.onmousemove = body.oncopy = body.oncut = body.onpaste = body.onkeydown = body.oncontextmenu = body.onmousemove = body.onselectstart = body.ondragstart = doc.onselectstart = doc.oncopy = doc.oncut = doc.onpaste = doc.onkeydown = doc.oncontextmenu = doc.onmousedown = doc.onmouseup = null;
  6. body.style.webkitUserSelect = 'auto';
  7. function defaultHandler(event) {
  8. event.returnValue = true;
  9. }
  10. for (event_type in ['selectstart', 'copy', 'cut', 'paste', 'keydown', 'contextmenu', 'dragstart']) {
  11. html.addEventListener(event_type, defaultHandler);
  12. body.addEventListener(event_type, defaultHandler);
  13. doc.addEventListener(event_type, defaultHandler);
  14. }
  15. var jQuery = window.jQuery;
  16. if (jQuery) {
  17. jQuery(doc).unbind();
  18. jQuery(body).unbind();
  19. }
  20. var $Fn = window.$Fn;
  21. if ($Fn) {
  22. try {
  23. $Fn.freeElement(doc);
  24. $Fn.freeElement(body);
  25. } catch (e) {}
  26. }
  27. var jindo = window.jindo;
  28. if (jindo) {
  29. jindo.$A = null;
  30. }
  31. var url = doc.URL;
  32. var domain_pattern = /^https?:\/\/([^\/]+)/;
  33. var result = domain_pattern.exec(url);
  34. if (result) {
  35. try {
  36. switch(result[1]) {
  37. case 'www.qidian.com':
  38. case 'read.qidian.com':
  39. case 'big5.qidian.com':
  40. case 'www.qdmm.com':
  41. var element = doc.getElementById('bigcontbox');
  42. if (element) {
  43. element.onmousedown = null;
  44. }
  45. break;
  46. case 'www.motie.com':
  47. element = jQuery('.page-content>pre')[0];
  48. element.ondragstart = element.oncopy = element.oncut = element.oncontextmenu = null;
  49. break;
  50. case 'board.miznet.daum.net':
  51. var gaia = unsafeWindow.gaia;
  52. doc.removeEventListener('selectstart', gaia.blockContent, false);
  53. doc.removeEventListener('dragstart', gaia.blockContent, false);
  54. doc.removeEventListener('contextmenu', gaia.blockContent, false);
  55. doc.removeEventListener('copy', gaia.blockContent, false);
  56. doc.removeEventListener('keydown', gaia.blockContent, false);
  57. break;
  58. case 'book.zongheng.com':
  59. element = jQuery('.readcon')[0];
  60. element.style.webkitUserSelect = 'auto';
  61. element.onselectstart = null;
  62. break;
  63. case 'www.kasi-time.com':
  64. element = doc.getElementById('center');
  65. if (element) {
  66. element.onmousedown = null;
  67. element = element.getElementsByClassName('mainkashi');
  68. if (element) {
  69. element[0].style.webkitUserSelect = 'auto';
  70. }
  71. }
  72. break;
  73. case 'detail.china.alibaba.com':
  74. jQuery('div.mod-detail-gallery').unbind();
  75. break;
  76. case 'www.businessweekly.com.tw':
  77. jQuery('div.maincontent').unbind();
  78. break;
  79. case 'petitlyrics.com':
  80. doc.getElementById('lyrics_window').style.webkitUserSelect = 'auto';
  81. break;
  82. case 'tv.cntv.cn':
  83. doc.getElementById('epg_list').style.webkitUserSelect = 'auto';
  84. break;
  85. }
  86. } catch (e) {
  87. }
  88. }
  89. })();
复制代码

作者: bailong360    时间: 2015-2-26 14:01

回复 4# 867258173


你还没有下载Wget呢,Wget的作用是下载网页,把wget和htox32c与批处理放在同一目录下再执行

不过你也可以把网页另存为,然后
  1. @Set /P html=请把需要处理的.html文件拖进来:
  2. @HtoX32c /IP %html% >结果.txt
复制代码

作者: 867258173    时间: 2015-2-26 15:01

本帖最后由 867258173 于 2015-2-26 15:05 编辑

回复 5# CrLf


    谢了,另外下了个元素查看扩展,能直接复制了。
作者: 867258173    时间: 2015-2-26 15:04

本帖最后由 867258173 于 2015-2-26 15:18 编辑

回复 6# bailong360


    加上wget.exe导出的html打开后能直接复制,
作者: CrLf    时间: 2015-2-26 15:25

http://www.bathome.net/viewthread.php?tid=34442
作者: tigerpower    时间: 2015-2-26 16:43

把IE的安全级别调到 高 就可以了
作者: 867258173    时间: 2015-2-27 12:50

本帖最后由 867258173 于 2015-2-27 12:55 编辑

回复 10# tigerpower

感谢上面几位朋友帮助,无论哪种方法都能实现复制。

(^0^) 这招最简单,刚测试,能成功直接复制,安全级别调到最高后,IE浏览器直接能复制,其它浏览器则必须切换【兼容模式】后才能复制网页,比如其他360浏览器的【极速模式】这招就失效。
又学了一招,多谢。




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2