PDFsam BasicのSplit tools(分割ツール)の中の[しおりで分割]を使って、PDFファイルをしおりごとに分割する方法です。
しおりごとに分割するので、分割前のPDFファイルにしおりが設定してあることが前提条件になります。
(PDF関連ツールによっては「しおり」を「ブックマーク」と呼んでいる場合がありますが、ここでは「しおり」と表記します)
PDFを選択
ここで、分割したいPDFファイルを選択します。
[PDFを選択]ボタンをクリックしてファイルを選択するか、エクスプローラーで選択したファイルを枠内にドラッグ&ドロップすることで、PDFファイルの選択ができます。
分割の設定
1)しおりのレベルで分割
しおりのどの階層で分割するかの指定で、数値で指定します。
下の画像のように2階層のしおりが設定してある場合は、「1」を入力すると"章"で分割し、「2」を入力すると"節"で分割することになります。
入力枠右側の[]をクリックすると、上で選択したPDFファイルのしおりから選択できるレベルを表示してくれ、その中からレベルを選択できます。
2)一致する正規表現
しおりごとに分割するとき、しおりのテキストの中に指定した単語が含まれる場合だけ分割する、という設定です。
指定する単語を「.*」(ドットとアスタリスク)で挟んで入力欄に入力します。
例えば、「.*工事.*」と入力すると、「工事」が含まれるしおりで分割され、「工事」が含まれないしおり部分はその前のPDFファイルに入ります。
出力設定
1)ディレクトリを選択
[PDFの選択]で選択したファイルのあるフォルダが、自動的に入力されます。
別のフォルダを指定したい場合は、[参照]ボタンをクリックして、分割したファイルの出力先フォルダを指定します。
2)既存の場合上書きする
このチェックボックスにチェックを入れると、実行時に上書き確認のメッセージ(下の画像)を表示しないで、ファイルを出力します。
出力先フォルダに同じファイル名がないと分かっている場合や、あったとしても上書きしてかまわない場合は、このチェックを入れておいてもいいかもしれません。
3)出力ファイルを圧縮する
既定でチェックが入っています。
通常そのままでいいと思いますが、圧縮したくない場合はチェックを外します。
ただし、5)で指定する出力PDFバージョンが1.5未満の場合は、いずれにしても圧縮されません。
4)しおりを破棄する
出力するPDFファイルにしおりを残したくない場合は、ここにチェックを入れます。
例えば、2階層のしおりを設定しているPDFファイルを、しおりのレベル「2」で分割する場合、しおりは不要と思われますので、ここにチェックを入れることになると思います。
5)出力PDFバージョン
既定で「入力文書と同じにする」になっていて、[PDFを選択]で元のPDFファイルを指定すると、そのPDFのバージョンが既定に表示されます。
特にPDFバージョンを変更する必要がなければ、そのままでいいでしょう。
ファイル名の設定
生成するPDF文書名の接頭語
分割して出力するPDFファイルのファイル名の設定です。
既定で「PDFsam_」となっていて、そのまま出力すると「PDFsam_.pdf」が出力ファイル名になり、分割後のファイル名がすべて同じになってしまうので、自動的に[CURRENTPAGE]_PDFsam_[BASENAME]で出力するようになっています。
通常、「PDFsam_」は要らないでしょうから、[FILENUMBER##]_[BOOKMARK_NAME]辺り変更するのが良さそうです。
FILENUMBERの後ろの「##」がファイル番号の桁数の指定になっていて、この場合は「#」が2つなので2桁となり「03」「45」という書式でファイル番号が入ります。
「#」による桁数の指定は、[CURRENTPAGE]でも使えます。
【「#」の応用】
[CURRENTPAGE###15]のように後ろに数字を付けると、ページ番号などの数字にその数字を加えた数字にできます。
例えば、[CURRENTPAGE###]が「003」だとすると、[CURRENTPAGE###15]は「018」となります。
また、「#」で桁数をしてしないで[CURRENTPAGE15]のように数字だけ付けると、「3」が「18」となります。
【接頭語の選択】
入力欄で右クリックすると、接頭語が選択できます。
接頭語の内容は以下のとおりです。
[TIMESTAMP]:出力時の日付と時間
[BASENAME]:元のPDFファイルのファイル名(拡張子を除く)
[CURRENTPAGE]:元のPDFファイルでのページ番号
[FILENUMBER]:出力ファイルの出力順の連番
[BOOKMARK_NAME]:しおりテキスト
[BOOKMARK_NAME_STRICT]:しおりテキストの中の英字・数字だけにしたもの
[TOTAL_FILESNUMBER]:出力するPDFファイルのファイル数
【注意点・応用など】
出力するファイル名は、ファイルごとに同じにならない必要があるので、[BASENAME]を使うときは必ず他の接頭語と併用するようにします。
PDFファイルの先頭部分に表紙や目次があって、その部分にしおりが設定してない場合がありますが、そのときは「ファイル名の設定」で既定のままの設定だった場合、先頭部分は「01_[BOOKMARK_NAME].pdf」というファイル名で出力され、しおりが設定されている部分から、しおりのテキストがファイル名になって出力されます。
右クリックで選択する接頭語以外にも、入力したテキストはそのままファイル名に付加されます。
[CURRENTPAGE](元のPDFファイルでのページ番号)は要らないけど、出力ファイルを順番に並べたいときは、[FILENUMBER##]_[BOOKMARK_NAME]とするとファイル名の先頭に連番が付いて、順番に並びます。
[FILENUMBER]/[TOTAL_FILESNUMBER]とすると、「2/12.pdf」といったファイル名にできます。
実行
[実行]ボタンをクリックすると、設定に従ってしおりで分割したPDFファイルが出力されます。
コメント
コメントを投稿