返回列表发帖

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

1楼 跳转到 » 倒序看帖

打印

字体大小: tT

发表于 2015-9-16 11:15 | 只看该作者

[文件操作] [已解决]批处理有没有办法统计出多页PDF的页数呢？

有很多PDF,都是多页的（也就是说一个pdf文件里面含有多张图）。有没有办法统计出N个PDF的所有页数呢？
比如：有01.PDF（含5张图）、02.PDF（含22张图）、03.PDF（含38张图）都放到 E:\统计里面
然后统计出：有三个PDF共含65张图
谢谢

1 评分人数

Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

非常好的论坛

pcl_test

荣誉版主

Rank: 8 Rank: 8

帖子: 3041
积分: 5333
技术: 685
捐助: 0
注册时间: 2014-10-19

2楼

发表于 2015-9-16 16:04 | 只看该作者

利用网上所说的标识统计法
保存为批处理文件，跟pdf文件放在一起运行

@echo off 2>nul 3>nul
::需要安装.Net Framework 2.0及以上
::指定父文件夹
set "fd=E:\统计"
if not exist "%fd%" echo;路径有误&pause&exit
set "netpath=%systemroot%\Microsoft.NET\Framework"
for /f "delims=" %%a in ('dir /ad /b "%netpath%\v?.*"') do (
    if exist "%netpath%\%%a\csc.exe" (
        set "cscpath=%netpath%\%%a\csc.exe"
        goto :0
    )
)
echo;未安装.Net Framework 2.0及以上组件或相关程序丢失&pause&exit
:0
>"%tmp%\$" more +20 "%~f0"
"%cscpath%" /out:"%tmp%\$getpages.exe" "%tmp%\$"
echo;正在统计，稍后……
::输出到txt文件，下句修改为 >"文本.txt" "%tmp%\$getpages.exe" "%fd%"
"%tmp%\$getpages.exe" "%fd%"
pause&exit
using System;
using System.IO;
using System.Text.RegularExpressions;
namespace GetPages
{
    class PDFPageCount
    {
        static void Main(string[] args)
        {
            int i=0,s=0;
            String path = args[0].ToString();
            String[] files = Directory.GetFiles(path, "*.pdf", SearchOption.AllDirectories);
            foreach (string file in files)
            {
                FileStream fs = new FileStream(file, FileMode.Open, FileAccess.Read);
                StreamReader sr = new StreamReader(fs);
                string pdfText = sr.ReadToEnd();
                Regex regexp = new Regex(@"/Type\s*/Page[^s]");
                MatchCollection matches = regexp.Matches(pdfText);
                i++;
                s+=matches.Count;
                Console.WriteLine(file+"\t"+matches.Count);
            }
            Console.WriteLine("----------------------\r\n"+i+" Files\t"+s+" Pages");
        }
    }
}
复制代码

3 评分人数

CrLf: c#技术 + 1
001011: 非常感谢完美运行技术 + 1
回家路上: 发现pcl又多了一项技能...C#...技术 + 1

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

3楼

发表于 2015-9-16 16:42 | 只看该作者

不知道能不能加一个路径上去这样可以统计一个文件夹下的所有PDF文件谢谢

非常好的论坛

TOP

pcl_test

荣誉版主

Rank: 8 Rank: 8

帖子: 3041
积分: 5333
技术: 685
捐助: 0
注册时间: 2014-10-19

4楼

发表于 2015-9-16 17:04 | 只看该作者

回复 3# 001011

每个文件夹单独统计？还是所有文件夹一起统计？

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

5楼

发表于 2015-9-16 17:10 | 只看该作者

所有文件夹一起统计谢谢

非常好的论坛

TOP

CrLf

论坛巡查

Rank: 8 Rank: 8

帖子: 6388
积分: 18843
技术: 982
捐助: 100
注册时间: 2010-10-9

6楼

发表于 2015-9-16 17:30 | 只看该作者

回复 2# pcl_test

这样都可以！！！卧槽！！！卧槽！！！！！

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

TOP

pcl_test

荣誉版主

Rank: 8 Rank: 8

帖子: 3041
积分: 5333
技术: 685
捐助: 0
注册时间: 2014-10-19

7楼

发表于 2015-9-16 17:38 | 只看该作者

回复 5# 001011

已修改

TOP

CrLf

论坛巡查

Rank: 8 Rank: 8

帖子: 6388
积分: 18843
技术: 982
捐助: 100
注册时间: 2010-10-9

8楼

发表于 2015-9-16 17:44 | 只看该作者

研究了一下，原来 pdf 是基于 postscript，那也可以用 grep、findstr 之类的工具实现

grep -c "Type\s*/Page" *.pdf
复制代码

然后将结果减一即可

不过我好奇的是，严格来讲，如果 pdf 里包含 Type/Page 会怎样呢？

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

9楼

发表于 2015-9-16 18:05 | 只看该作者

我貌似遇到高人了啊
连巡查都卧槽！！！卧槽！！！！！
呵呵
非常感谢高人啊

非常好的论坛

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

10楼

发表于 2015-9-16 18:07 | 只看该作者

只是执行效率有点低 257个PDF 快三分钟了还没有执行完
我准备把10多万个的PDF 全部统计一遍呢

非常好的论坛

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

11楼

发表于 2015-9-16 18:19 | 只看该作者

貌似是识别完了没有提示

非常好的论坛

TOP

回家路上

少尉

Rank: 5 Rank: 5

帖子: 359
积分: 603
技术: 66
捐助: 0
注册时间: 2014-11-19

12楼

发表于 2015-9-16 18:25 | 只看该作者

是啊，PDF没有自带个页数的属性呢，这样通过文本正则解析提取，如果pdf大的话，确实费时。
但能提取就已经是惊喜了。

人生是一部书/只有这一页最温暖/读懂它的时候/我们在远方流泪...

TOP

001011

六级士官

Rank: 4

帖子: 261
积分: 378
技术: 0
捐助: 0
注册时间: 2011-6-26

13楼

发表于 2015-9-16 18:29 | 只看该作者

呵呵也是啊

非常好的论坛

TOP

a6236130

二级士官

Rank: 2

帖子: 94
积分: 181
技术: 0
捐助: 30
注册时间: 2018-6-3

14楼

发表于 2019-8-9 11:18 | 只看该作者

为什么没有文本.txt生成出来？我都找过了

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文件操作] [已解决]批处理有没有办法统计出多页PDF的页数呢？

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]