カテゴリー: PDF
サブスクリプション制のサービスが増えてきましたが、中でも、お値段以上のコンテンツを提供しているのが、Kindle Unlimited です。これは特にプログラマーにはとても優しい、おすすめの サービスになっています。
qpdfを使って一括で フォルダ内 のすべてのPDFのパスワードを解除する
フォルダ内 のすべての PDF ファイルをDecryptする方法です。
Mac/Linuxの場合
シェルスクリプトを以下のように組むだけです。フォルダ内から実行してください。
1 2 3 4 5 6 |
#!/bin/bash for file in `\find . -maxdepth 1 -name '*.pdf'`; do newfile=${file%.*}_P.pdf echo${newfile} qpdf --decrypt ${file} ${newfile} done |
WindowsでもBashを使えば動くのかな。そこは未テストですが、それよりBATファイルを作ったほうが早いような気がします。
解除後のファイル名は3行目で決定しているので、自由に変更してください。
エラー対策 pdftk Warning: data bookmark record not valid — skipped; data:
pdftk にて栞情報をいじろうとしたときに、以下のようなエラーが出ることがあります。
1 2 3 4 5 |
pdftk Warning: data bookmark record not valid -- skipped; data: BookmarkBegin BookmarkTitle: 繝ゥ繝懊Ξ繝シ繧キ繝ァ繝ウ・罰Ξ繝シ繧縺ァ縺ゅk逅 BookmarkLevel: 0 BookmarkPageNumber: 123 |
“エラー対策 pdftk Warning: data bookmark record not valid — skipped; data:” の続きを読む
pdftkで しおりファイル がインポートできない場合の対策
pdftk用の しおり ファイル がうまくインポートできない場合が多々あります。
しおり情報以外にも、PDFのダンプ情報がうまくインポートできない場面は多々あります。
これらの問題に共通した対策です。
PDFtk で dump_data / dump_data_utf8 が成功しない 場合の対策
PDFtk で dump_data を実行しても、しおりファイルがうまく出力されない場合があります。その場合の対応です。
PDF の 印刷禁止 と コピー禁止 を解除する
印刷禁止 の PDF や テキストコピーなどのガード がかかった PDF ほど使えないものは有りません。通常であれば、これらを解除するには、パスワードが必要ですが、普通に開くことができるPDFであれば、これらのセキュリティ設定は外すことができます。
今回は2種類の方法を解説します。自分にあった方法をお試しください。
pdftk で しおり情報抽出時 に OWNER PASSWORD REQUIRED エラーが出る
pdfに関して、いろんなことがコマンドラインで処理できる pdftk ですが、こんなメッセージが出ることがあります。
エラーメッセージ
1 2 3 4 5 6 7 8 |
$ pdftk input-pdf.pdf dump_data_utf8 output output-index-path.txt Error: Failed to open PDF file: input-pdf.pdf OWNER PASSWORD REQUIRED, but not given (or incorrect) Errors encountered. No output created. Done. Input errors, so no output created. |
パスワード による機能制限がかかった PDF を解除する qpdf
開けるんだけど、 パスワード による 印刷制限 がかかっていて使いづらいアホみたいな PDF が世の中にはあります。このようなPDFには、qpdf というツールを利用すると幸せになれます。
pdftk: Bad CPU type in executable というエラーが出る場合の対策
macOSにて、インストーラを実行後、pdftkコマンドを利用すると、以下のようなエラーが発生することがあります。
1 2 |
$ pdftk -bash: /usr/local/bin/pdftk: Bad CPU type in executable |
この場合の原因と対策です。
PDF の しおり (目次/インデックス)を入力、出力する。import/export
PDF にOCRをかけたり、特殊なソフトで処理を行うと、 しおり 情報が消失することがあります。
そういった場合に、現状のしおり情報をテキストとして保存しておければ、再度、しおり情報を復元することができます。
また、この方法は、しおり情報が貧弱なPDFや、誤字脱字があるしおり情報をテキストとしてエクスポートしておき、テキストエディタで編集した後、再度、インポートするという方法にも使うことができます。
以下、その手順です。