标题: [问题求助] powershell将word另存多个文件 [打印本页]
作者: 5i365 时间: 2022-10-2 06:54 标题: powershell将word另存多个文件
本帖最后由 5i365 于 2022-10-2 07:01 编辑
有一个word文件, 一共有N章, 每章的标题样式都是 标题一
我想把每章标题及其下内容抽取出来另存为一个新的docx文件, 文件名就是标题一的文本
很有规律, 另外,每章都是从一页的最开头有的内容
有一个难点, 页眉中的页码要保留拆分前的页码
求大侠支招, 提前感谢
测试文件
https://send.cm/d/FM5T
作者: idwma 时间: 2022-10-4 19:32
大概像这样- #@&cls&powershell "type '%~0'|out-string|iex"&pause&exit
- $in='测试.docx'
- $out=$in+'.zip'
- copy $in ($in+'.zip')
- $f=gi $out
- $xf='document.xml'
- $shell=New-Object -com shell.application
- $shell.Namespace("$pwd").MoveHere($($shell.NameSpace($f.fullname+'\word').items()|?{ $_.name -eq $xf }))
- $xf=gi $xf
- $a=gc $xf -enc utf8
- $a[1] -match '(?<=\<w:body\>).*(?=\<w:sectpr)'
- $b=$matches[0]
- $c=$b -split '(?<!^)(?=<w:p\s[^>]+><w:ppr><w:pStyle w:val="1"/>.*</w:p>)'
- del $xf
- $c|%{
- $d=$_ -split '(?<!^)(?=<w:p\s[^>]+>)'
- $fn=$d[0] -replace '<[^>]+>'
- $zip=$fn+'.zip'
- copy $out $zip
- $zip=gi $zip
- [io.file]::WriteAllLines($xf.fullname,($a -replace '(?<=\<w:body\>).*(?=\<w:sectpr)',$_))
- $shell.Namespace($zip.fullname+'\word').moveHere($xf.fullname)
- while(test-path $xf){sleep -m 100}
- mv $zip ($zip.basename+'.docx')
- }
- del $out
复制代码
作者: 5i365 时间: 2022-10-5 07:23
回复 2# idwma
多谢大侠帮忙,
试了一下, 示例的文件可以正确输出, 但是实际的文件,输出后都打不开了
显示下面的错误
作者: idwma 时间: 2022-10-5 13:12
实际文档里document.xml文件的内容是什么样的
处理分段的地方可能要改一下
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |