PDF:操作コマンド一覧

目次
PDF操作の代表的なコマンド一覧と概要
PDF操作コマンドの概要
PDF(Portable Document Format)は、書類のレイアウトやフォント、画像情報などを維持したまま配布・共有できる標準的な電子文書フォーマットです。Linuxでは、このPDFファイルを自在に加工・編集・検索・変換できる多くのコマンドラインツールやユーティリティが利用できます。CLIツールは大量処理や自動化、スクリプト化に適しており、GUIツールは直感的なページ編集や分割・結合などに便利です。ここでは、用途ごとに使い分けたい主なPDF操作コマンドをまとめます。
主なPDF操作コマンド一覧
- pdftk:PDFの結合、分割、特定ページの抽出、暗号化・パスワード解除、しおりの編集など、多機能なPDFユーティリティ。バッチ処理や大量ファイルの一括操作にも強い。
- qpdf:PDFファイルの構造変換、暗号化・復号化、圧縮解除、ページ結合や抜き出しに対応。パスワード付きPDFの処理や、電子署名済みPDFの調査にも使える。
- pdfseparate / pdfunite:PDFをページごとに分割(pdfseparate)、複数PDFを1つに統合(pdfunite)するコマンド。poppler-utilsに含まれ、シンプルな用途で便利。
- mutool:PDFのページ・テキスト・画像の抽出や、PDF自体の最適化・修復、情報解析を行う高度なツール。
- pdftohtml / pdftotext / pdftoppm / pdftocairo:PDFをHTMLやテキスト、画像(ppm, png, svg, psなど)に変換。データの再利用やWeb化にも役立つ。
- pdfinfo:PDFの作成日・作成者・ページ数・PDFバージョン・用紙サイズなど、メタ情報を詳細表示。
- pdfgrep:grepのような感覚で、PDFファイル内のテキスト検索ができる。検索結果の抽出やバッチ処理に便利。
- pdfarranger:GUIでページの入れ替え、結合、削除、抽出などをドラッグ&ドロップで簡単に行える。複数PDFのレイアウト編集や資料作成に向く。
- ghostscript (gs):PDFを他形式に変換、圧縮、ページ抽出、画像化、セキュリティ設定変更など多機能な画像処理エンジン。
- pdftools(Pythonライブラリ):Pythonやコマンドラインで、PDFの内容抽出、生成、加工ができる。
- ocrmypdf:画像化されたPDFにOCR(文字認識)をかけて、検索可能なPDFを自動生成する。スキャンデータの活用や電子化に最適。
- poppler-utils:pdfto*系コマンドやpdfinfoなど、多数のPDFユーティリティ群をまとめたパッケージ。変換・抽出系の標準的な選択肢。
- pdfcpu:PDFの圧縮、分割、結合、暗号化、メタデータ編集など多機能なGo製CLIツール。
- pdfjam:LaTeX環境で複数ページのレイアウト・並べ替え・余白設定・分割印刷などを行う。
- pdfmod:PDFのメタデータ編集やページ削除・回転などができるシンプルなGUIツール。
PDF操作コマンドの活用例
- 書類をひとつのPDFにまとめたり、逆に章ごとに分割したいとき
- スキャンしたPDFをOCR化して検索できるようにする場合
- 資料や論文の一部だけ抜き出して配布・再利用したいとき
- 紙資料の電子化、PDFから画像やテキストデータの抽出
- パスワード付きや暗号化PDFの解除、セキュリティの再設定
- バッチ処理や自動化スクリプトで複数PDFを一括加工
- レポートやプレゼン資料をGUIで直感的に並べ替え・編集したい場合
まとめ
LinuxのPDF操作コマンドは、CLIツール・GUIツールともに用途が非常に幅広く、業務効率化や資料整理・研究用途・電子化など多彩な場面で活用できます。処理したい内容に応じて最適なツールを選択し、コマンドラインの柔軟性や自動化能力を最大限活用しましょう。





