- 帖子
- 12
- 积分
- 19
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2011-4-20
|
2楼
发表于 2011-4-22 17:25
| 只看该作者
里面有图片预览和精选文章,用curl下载抓取,应该可以抓到精选文章里面的文,然后用HtoX32c转换成txt,我已经抓取到txt文本了,可是没登陆,文章只有一部分,而且我用cd.>21146.txt
for %%i in (txt\*.txt) do (
title 正在整理 %%~nxi
echo.>>21146.txt
findstr /ib "21146" %%i>>21146.txt
echo.>>21146.txt
findstr /ibc:" " %%i>>21146.txt
)
得到的是一个空21146.txt文件!求解!??? |
|