标题: [文本处理] [已解决]怎样用批处理将网页原有格式内容复制到Word文档和txt文档? [打印本页]
作者: 867258173 时间: 2015-2-26 12:27 标题: [已解决]怎样用批处理将网页原有格式内容复制到Word文档和txt文档?
本帖最后由 867258173 于 2015-2-27 12:57 编辑
http://www.hgamecn.com/htmldata/article/2734.html
这网页,右键【复制】和【Ctrl+C】都失效,无法复制,不知能用批处理将这网页内容全复制到Word文档和txt文档吗?
作者: bailong360 时间: 2015-2-26 12:55
本帖最后由 bailong360 于 2015-2-26 12:57 编辑
又见到你了.
话说右键可以查看网页源代码,
火狐,Chrome内核的浏览器及新版IE还可以审查元素,或者运行js代码.
如果非要用批处理的话...只能想到这种办法了- @Wget -O a.html http://www.hgamecn.com/htmldata/article/2734.html
- @HtoX32c /IP a.html
- @Start a.txt
复制代码
http://batch-cn.qiniudn.com/tool/wget.exe
http://batch-cn.qiniudn.com/tool/HtoX32c.exe
作者: 867258173 时间: 2015-2-26 13:04
本帖最后由 867258173 于 2015-2-26 13:13 编辑
回复 2# bailong360
好久没见,右键源代码是能复制,但是格式都乱了,空行之类的。这网页用360浏览器右键也能【保存为文本】,但是全保存成不换行无间隔文档,害的我每次都得看网页重新每一行每一行的按回车,烦都快烦死了
【源码保存这样】
<p>究极的差距是包围这个行星——地球的现实。<br />贫富差距遍及世界各处,天然资源枯竭已久。<br />荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。<br />不管如何祈祷,也不会有人向他们伸出援助之手。</p>
<p>这是神已经消失的世界的法则。但世界上存在着代替神向他们伸出援助之手的人。<br />漂浮在天空中的雪白的天体“Caelum Urbs (カエルム・ウルブス)”。<br />被称为“天空之城”的天界。居民被称为“天人”。</p>
<p>Caelum Urbs和地上不同,应有尽有。<br />还有因为发达的医疗科学,天人之间不存在死的概念。</p>
360浏览器右键【保存为文本】
究极的差距是包围这个行星——地球的现实。 贫富差距遍及世界各处,天然资源枯竭已久。 荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。 不管如何祈祷,也不会有人向他们伸出援助之手。
而我想要的格式是
究极的差距是包围这个行星——地球的现实。
贫富差距遍及世界各处,天然资源枯竭已久。
荒废的大地上遍布着只能够仰望天空,乞求恩惠的人们。
不管如何祈祷,也不会有人向他们伸出援助之手。
这样
作者: 867258173 时间: 2015-2-26 13:26
本帖最后由 867258173 于 2015-2-26 13:30 编辑
回复 2# bailong360
不行,无法保存
作者: CrLf 时间: 2015-2-26 14:00
chrome 可以下一个 Enable Copy,碰到这种页面点一下就行,实测可用于 360 图书馆
chrome 应用商店下载地址:
https://chrome.google.com/websto ... nhncokdlaohlkneihio
或自行在控制台里黏贴并执行 Enable Copy 源码:- (function() {
- var doc = document;
- var body = doc.body;
- var html = doc.documentElement;
- html.onselectstart = html.oncopy = html.oncut = html.onpaste = html.onkeydown = html.oncontextmenu = html.onmousemove = body.oncopy = body.oncut = body.onpaste = body.onkeydown = body.oncontextmenu = body.onmousemove = body.onselectstart = body.ondragstart = doc.onselectstart = doc.oncopy = doc.oncut = doc.onpaste = doc.onkeydown = doc.oncontextmenu = doc.onmousedown = doc.onmouseup = null;
- body.style.webkitUserSelect = 'auto';
-
- function defaultHandler(event) {
- event.returnValue = true;
- }
- for (event_type in ['selectstart', 'copy', 'cut', 'paste', 'keydown', 'contextmenu', 'dragstart']) {
- html.addEventListener(event_type, defaultHandler);
- body.addEventListener(event_type, defaultHandler);
- doc.addEventListener(event_type, defaultHandler);
- }
-
- var jQuery = window.jQuery;
- if (jQuery) {
- jQuery(doc).unbind();
- jQuery(body).unbind();
- }
-
- var $Fn = window.$Fn;
- if ($Fn) {
- try {
- $Fn.freeElement(doc);
- $Fn.freeElement(body);
- } catch (e) {}
- }
-
- var jindo = window.jindo;
- if (jindo) {
- jindo.$A = null;
- }
-
- var url = doc.URL;
- var domain_pattern = /^https?:\/\/([^\/]+)/;
- var result = domain_pattern.exec(url);
- if (result) {
- try {
- switch(result[1]) {
- case 'www.qidian.com':
- case 'read.qidian.com':
- case 'big5.qidian.com':
- case 'www.qdmm.com':
- var element = doc.getElementById('bigcontbox');
- if (element) {
- element.onmousedown = null;
- }
- break;
- case 'www.motie.com':
- element = jQuery('.page-content>pre')[0];
- element.ondragstart = element.oncopy = element.oncut = element.oncontextmenu = null;
- break;
- case 'board.miznet.daum.net':
- var gaia = unsafeWindow.gaia;
- doc.removeEventListener('selectstart', gaia.blockContent, false);
- doc.removeEventListener('dragstart', gaia.blockContent, false);
- doc.removeEventListener('contextmenu', gaia.blockContent, false);
- doc.removeEventListener('copy', gaia.blockContent, false);
- doc.removeEventListener('keydown', gaia.blockContent, false);
- break;
- case 'book.zongheng.com':
- element = jQuery('.readcon')[0];
- element.style.webkitUserSelect = 'auto';
- element.onselectstart = null;
- break;
- case 'www.kasi-time.com':
- element = doc.getElementById('center');
- if (element) {
- element.onmousedown = null;
- element = element.getElementsByClassName('mainkashi');
- if (element) {
- element[0].style.webkitUserSelect = 'auto';
- }
- }
- break;
- case 'detail.china.alibaba.com':
- jQuery('div.mod-detail-gallery').unbind();
- break;
- case 'www.businessweekly.com.tw':
- jQuery('div.maincontent').unbind();
- break;
- case 'petitlyrics.com':
- doc.getElementById('lyrics_window').style.webkitUserSelect = 'auto';
- break;
- case 'tv.cntv.cn':
- doc.getElementById('epg_list').style.webkitUserSelect = 'auto';
- break;
- }
- } catch (e) {
- }
- }
- })();
复制代码
作者: bailong360 时间: 2015-2-26 14:01
回复 4# 867258173
你还没有下载Wget呢,Wget的作用是下载网页,把wget和htox32c与批处理放在同一目录下再执行
不过你也可以把网页另存为,然后- @Set /P html=请把需要处理的.html文件拖进来:
- @HtoX32c /IP %html% >结果.txt
复制代码
作者: 867258173 时间: 2015-2-26 15:01
本帖最后由 867258173 于 2015-2-26 15:05 编辑
回复 5# CrLf
谢了,另外下了个元素查看扩展,能直接复制了。
作者: 867258173 时间: 2015-2-26 15:04
本帖最后由 867258173 于 2015-2-26 15:18 编辑
回复 6# bailong360
加上wget.exe导出的html打开后能直接复制,
作者: CrLf 时间: 2015-2-26 15:25
http://www.bathome.net/viewthread.php?tid=34442
作者: tigerpower 时间: 2015-2-26 16:43
把IE的安全级别调到 高 就可以了
作者: 867258173 时间: 2015-2-27 12:50
本帖最后由 867258173 于 2015-2-27 12:55 编辑
回复 10# tigerpower
感谢上面几位朋友帮助,无论哪种方法都能实现复制。
(^0^) 这招最简单,刚测试,能成功直接复制,安全级别调到最高后,IE浏览器直接能复制,其它浏览器则必须切换【兼容模式】后才能复制网页,比如其他360浏览器的【极速模式】这招就失效。
又学了一招,多谢。
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |