PDF：操作コマンド一覧

2025年12月5日 2025年12月5日

KoAN

PDF操作の代表的なコマンド一覧と概要

PDF操作コマンドの概要

PDF（Portable Document Format）は、書類のレイアウトやフォント、画像情報などを維持したまま配布・共有できる標準的な電子文書フォーマットです。Linuxでは、このPDFファイルを自在に加工・編集・検索・変換できる多くのコマンドラインツールやユーティリティが利用できます。CLIツールは大量処理や自動化、スクリプト化に適しており、GUIツールは直感的なページ編集や分割・結合などに便利です。ここでは、用途ごとに使い分けたい主なPDF操作コマンドをまとめます。

主なPDF操作コマンド一覧

pdftk：PDFの結合、分割、特定ページの抽出、暗号化・パスワード解除、しおりの編集など、多機能なPDFユーティリティ。バッチ処理や大量ファイルの一括操作にも強い。
qpdf：PDFファイルの構造変換、暗号化・復号化、圧縮解除、ページ結合や抜き出しに対応。パスワード付きPDFの処理や、電子署名済みPDFの調査にも使える。
pdfseparate / pdfunite：PDFをページごとに分割（pdfseparate）、複数PDFを1つに統合（pdfunite）するコマンド。poppler-utilsに含まれ、シンプルな用途で便利。
mutool：PDFのページ・テキスト・画像の抽出や、PDF自体の最適化・修復、情報解析を行う高度なツール。
pdftohtml / pdftotext / pdftoppm / pdftocairo：PDFをHTMLやテキスト、画像（ppm, png, svg, psなど）に変換。データの再利用やWeb化にも役立つ。
pdfinfo：PDFの作成日・作成者・ページ数・PDFバージョン・用紙サイズなど、メタ情報を詳細表示。
pdfgrep：grepのような感覚で、PDFファイル内のテキスト検索ができる。検索結果の抽出やバッチ処理に便利。
pdfarranger：GUIでページの入れ替え、結合、削除、抽出などをドラッグ＆ドロップで簡単に行える。複数PDFのレイアウト編集や資料作成に向く。
ghostscript (gs)：PDFを他形式に変換、圧縮、ページ抽出、画像化、セキュリティ設定変更など多機能な画像処理エンジン。
pdftools（Pythonライブラリ）：Pythonやコマンドラインで、PDFの内容抽出、生成、加工ができる。
ocrmypdf：画像化されたPDFにOCR（文字認識）をかけて、検索可能なPDFを自動生成する。スキャンデータの活用や電子化に最適。
poppler-utils：pdfto*系コマンドやpdfinfoなど、多数のPDFユーティリティ群をまとめたパッケージ。変換・抽出系の標準的な選択肢。
pdfcpu：PDFの圧縮、分割、結合、暗号化、メタデータ編集など多機能なGo製CLIツール。
pdfjam：LaTeX環境で複数ページのレイアウト・並べ替え・余白設定・分割印刷などを行う。
pdfmod：PDFのメタデータ編集やページ削除・回転などができるシンプルなGUIツール。