pdftkで しおりファイル がインポートできない場合の対策

Adobe PDF
pdftk用の しおり ファイル がうまくインポートできない場合が多々あります。
しおり情報以外にも、PDFのダンプ情報がうまくインポートできない場面は多々あります。
これらの問題に共通した対策です。
 


原因1(よくある)

しおりファイル中(テキストファイル中)にタブが含まれる

 

しおりファイルを作成する場合、Excelなどの表計算ツールを使って整形することが多いと思います。
この場合、データをコピペした場合、TAB情報が含まれてしまう場合があります。

 

pdftkのインポート機能はフォーマットについて非常にシビアです。
そのため、タブがあったりとかデリミタがなかったりとか、不測の事態には柔軟に対応してくれません。

 

対策

1.しおりファイルからTAB情報を削除する。
2.フォーマットが正しいか事前に確認する。
3.編集時に使用するVSCODEなどのテキストエディタでTAB表示を有効にしておく

 


原因2

PageMediaBeginでページ番号が定義されていない。

 

対策

前述したように、pdftkのしおり情報は非常にシビアです。
一旦、dump_data_utf8 オプションで作成したエクスポートファイルを修正するようにしてみましょう。

 


原因3

文字コードが不適切

 

対策

日本語を含む場合は、 update_info_utf8 で取り込みますから、文字コードはUTF8で作成しましょう。
一般的には VSCODE を使用した作成がよろしいかと思われます。
 

原因4

フォーマットが壊れている。

 

pdftkはフォーマットが壊れていても、エラーが表示されずに終了することがあり、なかなか原因に気付きづらくなっています。

 

対策

一旦、dump_data_utf8 オプションで作成したエクスポートファイルを修正するようにしてみましょう。

合わせて読みたい

pdftk で しおり情報抽出時 に OWNER PASSWORD REQUIRED エラーが出る

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です