[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

【完成】epub文档添加字符(80元)

本帖最后由 lxh623 于 2024-11-4 18:14 编辑

当前文件夹下有许多文件夹,这些文件夹下\OEBPS\Text里面有多个xhtml。
正文:
<p><span class="text_1">..............</span></p>
如果行首算起大于624个字符,段落后</span></p>改为★</span></p>

谢谢!

本帖最后由 flashercs 于 2024-11-4 21:58 编辑
  1. <#*,:
  2. @echo off
  3. cd /d "%~dp0"
  4. set "batchfile=%~f0"
  5. Powershell -ExecutionPolicy Bypass -C "Set-Location -LiteralPath ([Environment]::CurrentDirectory);. ([ScriptBlock]::Create([IO.File]::ReadAllText($env:batchfile,[Text.Encoding]::GetEncoding(0) )) )"
  6. pause
  7. exit /b
  8. #>
  9. # <p><span class="text_1">..............</span></p>如果行首算起大于624个字符,段落后</span></p>改为★</span></p>
  10. $re = [regex]'(?s)(<p(?>[^>]*)>)(.*?)(</p>)'
  11. $evaluator = [System.Text.RegularExpressions.MatchEvaluator] {
  12.   param([System.Text.RegularExpressions.Match]$m)
  13.   if (($m.Groups[2].Value -replace '<[^>]*>').Length -gt 600) {
  14.     # 除了代码,纯粹汉字和标点符号是超过600个。
  15.     $m.Groups[1].Value + $m.Groups[2].Value + '★' + $m.Groups[3].Value
  16.   } else {
  17.     $m.Value
  18.   }
  19. }
  20. Get-ChildItem -Path '.\*\OEBPS\Text\*.xhtml' | Where-Object { $_ -is [IO.FileInfo] } | ForEach-Object {
  21.   $_ | Resolve-Path -Relative
  22.   $text = [IO.File]::ReadAllText($_.FullName)
  23.   $text = $re.Replace($text, $evaluator)
  24.   [IO.File]::WriteAllText($_.FullName, $text)
  25. }
复制代码
1

评分人数

微信:flashercs
QQ:49908356

TOP

谢谢!请查收。

TOP

本帖最后由 lxh623 于 2024-11-4 20:35 编辑

回复 2# flashercs
有一个小问题,能不能帮我再修改,谢谢!
除了代码,纯粹汉字和标点符号是超过600个。
段落中间有代码的话,也希望一样处理。比如,
  1. 一切相智樂苦,</span><span class='corr'><span class="text_1">若</span></span><span class="text_1">行四
复制代码

TOP

回复 4# lxh623


    上面修改了.
微信:flashercs
QQ:49908356

TOP

返回列表