标题: [技术讨论] [分享]Powershell提取html网页标题,过滤后重命名html文件名 [打印本页]
作者: wxyz0001 时间: 2021-4-26 15:52 标题: [分享]Powershell提取html网页标题,过滤后重命名html文件名
本帖最后由 wxyz0001 于 2021-4-26 17:33 编辑
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名:
573.html
688.html
741.html
html源文件里的标题<title>行:
<title>两幅油画的故事 - 读者文摘杂志(dzwzzz.com)</title>
<title>马克·扎克伯格的“脸谱” - 读者文摘杂志(dzwzzz.com)</title>
<title>戏比天大情比海深 - 读者文摘杂志(dzwzzz.com)</title>
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
代码如下:- $thePath="E:\news" #获取目录路径
- Get-ChildItem -Path $thePath -Filter "*.html"|ForEach-Object{
- $extension=$_.Extension #取扩展名
- $fileName=((get-content $_.FullName)|Select-String -Pattern "<title>" -Encoding default).Line -Replace([Regex]::Escape("<title>")),"" -Replace([Regex]::Escape(" - 读者文摘杂志(dzwzzz.com)</title>")),"" #取文件名-过滤
- $newName='{0}{1}' -f $fileName,$extension #过滤后的文件名+扩展名-格式化
- Rename-Item -Path $_.FullName -NewName $newName} #重命名文件名
复制代码
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名 重命名后的html文件名:
----------------------------------------------------------
573.html 两幅油画的故事.html
688.html 马克·扎克伯格的“脸谱”.html
741.html 戏比天大情比海深.html
作者: wxyz0001 时间: 2021-4-26 16:04
bat批量重命名html文件名的代码:
http://www.bathome.net/thread-54266-1-1.html
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |