Python で PDF ファイルの結合・分割

Posted on 2020/09/16 in programming , Updated on: 2020/09/16

はじめに

Python のサードパーティライブラリの PyPDF2 を使用した PDF ファイルの結合および分割方法。
公式ドキュメント

インストール

pip でインストール可能

In [ ]:
$ pip install PyPDF2

PDFファイルの結合

PdfFileMerger クラスを使用する。
下記例では、カレントディレクトリに、test1.pdftest2.pdf が存在し、それらを結合して、test3.pdf を出力する。

In [ ]:
import PyPDF2

merger = PyPDF2.PdfFileMerger()

merger.append('test1.pdf')
merger.append('test2.pdf')

merger.write('test3.pdf')
merger.close()

PDFファイルの分割

pdf内の任意のページを指定し、新たなファイルとして生成する。

ページ指定は、append() 関数の引数 page で指定する。 指定方法は、(start, stop)

下記例では、test1.pdf の 2ページから10ページを抜き出して、test4.pdf として保存する。

In [ ]:
import PyPDF2

merger = PyPDF2.PdfFileMerger()

# page は 0 始まりの数字で指定。2ページ目は 1
merger.append('test1.pdf', pages=(1, 9))

merger.write('test4.pdf')
merger.close()