So-net無料ブログ作成

「解像度最適化・文字明瞭化・余白カット・OCR化」が可能な、いきなりPDF for 自炊

ソースネクストから、自炊データ編集ソフト「いきなりPDF for 自炊」が発売されています。
このソフトは、iPad/iPhoneなどのスマートホン・タブレットPCで見やすくなるように自炊データの色々加工してするソフトです。

購入していないので、実際の使い勝手は分かりませんが、下記の機能が利用できるようです。

  • 各端末の解像度に最適なサイズに変換
  • PDF内の文字を検索
  • 文字をくっきり読みやすく補正
  • 余白を自動でカット


最適なサイズに簡単変換
kindleやSony Reader(ソニーリーダー)は本体の処理能力が低いため、スキャンした自炊データを読む場合、ページ送りや表示まで時間がかかったりします。そこで、各端末に合わせた解像度に変換してデータサイズを小さくすることで、スムーズな表示が出来るようになります。

PDF内の文字を検索(Panasonic製の文字認識機能)
スキャンした本に対してOCR処理することで文字の選択ができるようになり、キーワード検索やしおり登録などが出来るようになります。

文字をくっきり読みやすく補正
細いフォントで印刷された本などをスキャンすると薄くて読めない場合があります。そのようなときは、この文字を太く見せる文字補正機能を使うことで、はっきりと読みやすくなります。

余白を自動でカット
本を読む端末によっては画面が小さいため、表示される文字も小さく見にくくなります。本の余白をカットすることで、画面いっぱいに文字が表示でき読みやすくなります。

その他に、zipでまとめたファイル対応や、変換作業中はバックグラウンドで動き、途中でシャットダウンとしても次回起動時に自動再開するので大量に変換作業を行う時は便利です。

文字をくっきりや余白カットは、多少手間ですが下記のページで方法を紹介しているので、手軽に行いたいという人に向いているソフトという感じでしょうか。

PDFの余白を削除・切り取り・トリミングして調整

PDFの色が薄い文字(本・書類をスキャン)画像を濃くする

 
 

 

Acrobatのハイライト・注釈・しおり・リンクを活用する

ScanSnap iX500、S1500に付属のAcrobatには、電子書籍を活用するうえで、便利な下記の機能が付いています。

  • ハイライト(マーカー・蛍光ペン) 
  • ノート注釈(メモ機能)
  • しおり
  • リンク

これらの機能は、書き込みを行っても後から削除することができますし、ハイライトや注釈した箇所を一覧表示できるなど、電子化のメリットを生かした使い方ができます。

使い方は簡単ですので、ぜひ活用してみてください。



ハイライト(マーカー・蛍光ペン)

ハイライトしたい文字を選択して、右クリックをしてメニューから「テキストをハイライト表示」を選択。

Acrobatのハイライト(マーカー・蛍光ペン)機能

 

すると、黄色の蛍色でハイライトされます。

Acrobatのハイライト(マーカー・蛍光ペン)機能効果

また、ハイライトの上で右クリックをしてメニューから「削除」を選択すると消すことができます。

 



ノート注釈(メモ機能)

ページにコメントやメモを記入したい時に使用します。

ノート注釈をしたい部分で、右クリックをしてメニューから「ノート注釈の追加」を選択します。

Acrobatのノート注釈(メモ機能)

 

入力モードになりますので、記入したい文章を入力します。入力し終わったら、オプション▼と書かれた右上にある四角い閉じるマークをクリックします。

Acrobatのノート注釈(メモ機能)で文字を書き込む

 

ノート注釈マークがつきました。

ノート注釈(メモ機能)マークが表示

 

ノート注釈マークの上にマウスカーソルを重ねると入力した文章が表示され、クリックすると先程の入力モードに切り替わり文字の編集ができます。

ノート注釈(メモ機能)マークの上にマウスカーソルを乗せるとメモが表示される

 

また、メニューバーの「注釈→注釈のリストを表示」を選択すると、ハイライトとノート注釈したページがリストで、表示されるので便利です。

メニューバーから注釈のリストを表示を選択

 

下に表示されているのが注釈のリスト。「吹き出し」がノート注釈で、「T」のアイコンがハイライトを表しています。

ハイライト・ノート注釈のリストが表示表示される

 



しおり機能

気になったページを登録して、すぐに呼び出すことができます。

しおりの登録を行いたいページまたは文字を選択した状態で、右クリックをしてメニューから「しおりの追加」を選択します。

Acrobatのしおり追加機能

 

すると、しおり表示項目に新しくページが登録されます。文字を選択していない場合は「名称未設定」、行った場合は、その文字列がしおりのタイトルになります。もちろん、登録名を変更することができます。

Acrobatのしおり表示

ツリー構造で登録もできて便利です。

 


リンク機能

文字列に指定したページへのリンクをつけることができます。よく見るページへのリンクを張ることでページ移動が楽になります。

リンクを張りたい文字列を選択した状態で、右クリックをしてメニューから「リンクの作成」を選択します。

Acrobat リンクの作成

 

リンクを張るときの表示方法を指定して「次へ」を押します。

Acrobat リンクの作成 リンク表示方法

 

リンク先を決定するボタンが表示されるので、この状態でスクロールバーやページ番号を直接指定して、リンク先ページに移動します。

Acrobat リンクの作成ビュー指定を作成

 

ここでは、ページ番号を直接指定して移動することにします。メニューバーの「表示→移動→ページ」を選択します。

Acrobat リンク先ページ移動

 

移動先ページ番号を入力します。

Acrobat リンク先ページ移動指定

 

リンク先ページに移動したら、「リンクを設定」のボタンを押して完了です。

Acrobat リンク先ページでリンクを設定

 

リンクした文字にマウスカーソルを合わせると、反転してリンクしているのが確認できます。

Acrobat リンク作成完了

本の目次に各ページのリンクを張れば、すごく便利なのですが労力も使いますので、行うとしたら頻繁に使う本とか辞書になどに限定した方が無難です。

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

Acrobatの「ファイルサイズの縮小・ClearScan」を試す

ScanSnap iX500、S1500、S1300で自炊したPDFデータは、スキャンモードやページ数によりサイズが大きくなります。

一般的なPCや2012年春ごろにかけて発売されるタブレットPCでは、ファイルサイズはそれ程問題になりませんが、現在発売されているタブレットPCでは負担になるサイズで、閲覧するときなどもたつきが生じることがあります。

そこで、タブレットPC用にデータサイズを削減したPDFを作り、スムーズに表示できる方法を2つ紹介します。

ただ、この為だけにデータを作るのは面倒ですので、下記リンクもご参考ください。個人的には、こちらの方が手軽なのでお勧めです。

ipohone/ipad/ipod touch向けおすすめPDFビューアーbookman Lite

 



AcrobatのClearScan機能でPDFデータサイズを小さくする

ClearScanは、AcrobatでOCRを行う時に指定するオプションです。このClearScan指定を行うとスキャン画像の文字の箇所がフォントデータに置き換えるため、画像のデータを減らすことができサイズが小さくなります。

Acrobatのメニューバーから「文章→OCRテキスト認識→OCRを利用してテキストを認識」を選択。

「文章→OCRテキスト認識→OCRを利用してテキストを認識

 

また、フォントに置き換えため文字を拡大していっても文字がギザギザにならなず、なめらかな表示になります。

しかし、フォントの置き換えに失敗した文字は画像のままになったり、文字自体が消えてしまったりなどの症状があり完ぺきではありません。

下記の例では、上の列がフォントの置き換えに失敗し画像のままになった文字と、下がフォント置き換えに成功した文字。

Acrobat ClearScan 画像

 

次に、フォント置き換えに失敗し文字が消えてしまった例。

Acrobat ClearScan画像


また、ClearScanは、変換に時間がかかるのも難点です。グレースケール300dpiでスキャンしたPDFをpentium E5400(2.4Mhz)のPCにて、ClearScanで変換すると約30分かかります。

 



Acrobatのファイルサイズの縮小機能でPDFデータサイズを小さくする

こちらはスキャンしたデータの圧縮率を高めたり解像度を下げてデータサイズを小さくする方法です。

Acrobatのメニューバーから「文章→ファイルサイズを縮小」を選択。

文章→ファイルサイズを縮小

そのためページを拡大すると文字の周りがにじんだりするノイズが表れやすくなりますが、ipadなどのタブレットPCの画面サイズでは、それ程気にならないと思います。

acrobatファイルサイズ縮小比較

 



各データサイズ縮小の比較

取り込みスキャンモード原本ClearScanファイルサイズ縮小
カラー 圧縮2 300dpi151MB82MB41MB
グレー 圧縮2 300dpi143MB40MB42MB
白黒 600dpi(表紙を除く)10MB5.5MB5.3MB

 

AcrobatのClearScanとファイルサイズ縮小ファイルサイズ比較

グレーと白黒でスキャンしたデータサイズは同じぐらいですが、カラーのみ倍近く差がみられました。

ClearScanは、それ程頻繁ではありませんが文字が消えるなどの症状が現れることを考えると、タブレット端末用電子書籍としては「ファイルサイズ縮小」を選んだ方がいいかもしれません。

 

上記の方法は、あくまでipadなどのタブレットタイプ用のデータとして制作するものですので、元のデータ残しておきます。 

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

PDFのページ番号開始位置を挿入・変更・編集・ずらす方法

ScanSnap iX500、S1500に付属のAcrobatで、PDFのページ番号を追加・編集・変更してずらす方法について書きます。 

表紙を含めて電子化した本をPDFにした場合、表紙からページ番号をカウントするため、そのままでは本のページ番号とずれてしまいます。

 

PDFのページ番号がずれている

PDFのページ番号が17に対し、本のページ番号は14になっています。

このままでは、本に書かれている目次のページ番号をみて、直接該当ページに飛ぶ時に表紙分のページ数を足したページ番号を指定しなければならず不便です。

そこで、acrobatの文書処理機能で、ページ開始位置を挿入・変更・編集して本に書かれているページ番号と合わせ、書き換える作業を行います。

 

文書処理機能でページ開始位置を指定

メニューバーの「アドバンス」→「文書処理」→「ページ番号」を選択します。

 

開始ページで、ページ番号をカウントするページ位置を指定

ページ番号のウィンドウがでますので、ここで編集・挿入・編集作業を行います。

 

開始ページの項目で、新たにカウント(ページ番号を挿入)をはじめるページ番号を指定します。

お好みで「新セクション開始のスタイル」で、カウントする番号の種類が変更できます。これでOKボタンを押して、編集が終了です。

本とPDFのページ番号が同じになっているか確認

あとは、本とPDFのページ番号が変更済みになっているか確認し、保存して終了です。

kindleやipadで表示する時に、電子化した本を広く表示するために余白部分をトリミングする方法がありますが、このページ番号を合わせる処理を行うことで、ページ番号の部分もトリミングしてさらに広く表示することができます。

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

グレースケールでスキャンしたPDFを白黒変換する方法

scansnap s1500を使い、グレースケールの300dpiモードで自炊・本の電子化したPDFを白黒(単色・2色)モードに変換する方法を紹介します。

この方法は、すでにスキャンした本や書類を捨ててしまい、手元にグレースケールの300dpiしか残っていない人向けです。

原稿を白黒・600dpiで直接スキャンしたデータに比べると質が落ちると思いますので、念のため元データは捨てず、保存しておいた方が良いと思います。また、PDFの色が薄い文字(本・書類をスキャンした)画像を濃くする合わせてもご参考ください。

 

グレースケールから白黒へ変換するメリット
scansnapのグレースケールで自炊した場合、「モニターやキンドル(電子ペーパー)、印刷したとき薄く見えて困る」、「現在あるキンドル(Kindle)・ipadなどの電子リーダーだと記憶容量が少なくPDFのサイズが相対的に大きく感じる」などで、デメリットがあります。

この問題に対処する方法として白黒変換へが有効です。ただし写真や図などがある場合、その部分は見にくい状態になるので文字が中心の本・書類向けです(漫画はたぶん?向きません)。

各画像の比較
白黒600dpi、グレースケール300dpiの違い
右側がscansnapのグレースケールくっきりモード。
中央がscansnapのグレースケールくっきりモードにacrobatのファイルサイズ縮小を適応。
左側が右側の画像を白黒に変換。

ファイルサイズ縮小を適応したpdfは、圧縮の影響で文字の周りがかなり滲んでいます(画像をクリックすると大きいサイズで確認できます)。

pdf_change21.jpg
ファイルサイズの比較。上からscansnapグレースケールくっきりモード(300dpi)、scansnapグレースケールくっきりモードをacrobatのファイルサイズ縮小を適応(300dpi)、白黒(600dpi)に変換したpdf。ファイルサイズ縮小が一番サイズが小さいですが、上記の通り文字が強く滲むので実用性には?がつきます。


グレースケールから白黒へ変換手順
1.まず変換したいPDFから画像を書き出す。
2.画像ソフト・変換ツールを使いグレースケールから白黒へ変換。
3.変換後の白黒画像をPDFに変換する。



1.PDFから画像データの吐き出し
Adobe Acrobat(scansnapの上位機種には付属されています)をお持ちの方は、下記の方法で吐き出せます。


対象PDFをAcrobatで開き、メニューバーから「ファイル→書き出し→画像→jpeg」で吐き出します。

pdf_change02.jpg

 

保存先のフォルダを指定したら「保存」ボタンを押します。

pdf_change03.jpg



2.画像ソフトで画像を濃くし、300→600dpiへ変換します
ここでは、各画像(本のページ数分)に対して、「明るさ、画像の拡大、減色」などの調整を行います。

しかし、各画像に対して、手作業で行うと途方もない時間が掛かりますので、バッチ処理(複数の画像ファイルに対して、明るさなど変更する作業を一括で自動で行ってくれる機能。ソフトによってはコマンド処理といっている場合もあります)で、対応します。

バッチ処理ができるソフトとしては、Photoshop/Fireworksが有名ですが、高価ですし今回の作業の場合、若干手間がかかりますので、無料のフリーソフトで簡単にできるXnView*を使用することにします。

* XnViewについては下記サイトを参考ください。
窓の杜 XnView
http://www.forest.impress.co.jp/library/software/xnview/

Wikipedia XnView
http://ja.wikipedia.org/wiki/XnView

 

a.まず、グレースケールの状態で自分の好みの濃さを求めます(濃さに不満がなければこの部分は飛ばしてください)。

pdf_change04.jpg

白黒にするのだから濃さは関係ないのでは?と思いますが、色が薄い状態だと変換時に薄いグレーが白と判定される場合が多く、変換後の画像でギザギザが目立つ傾向があります。ですので、変換前にある程度しっかりした濃さにする必要があります。

XnViewを起動するとファイル選択画面になるので、先程吐き出した画像フォルダを選択し、どれか画像をクリックします。

 

選択した画像が大きく表示されます。このモードで、メニューバーの「画像→修正→明るさ/コントラスト/ガンマ/カラーバランス」を選択します。

pdf_change05.jpg

 

画像修正パネルが出ますので、コントラスト、ガンマなどをいじって自分の好みの濃さを割り出し、各数字をメモします。

pdf_change06.jpg

各数字をいじると、リアルタイムで画像が反映されますので、画像を見ながらいじるといいと思います。

メモをしたらキャンセルで閉じて、上のタブをダブルクリックすると、さらにこの編集画面が閉じられ起動時の画面に戻ります。

 

b.全ての画像に対して、濃さとdpi、カラー変換を行います
全ての画像に対して変更を自動で行います。

メニューバーの「ツール→一括変換」を選択します。
pdf_change07.jpg

 

先程開いたファイルがひとつリストに入ってしまっていると思うので、ある場合は一度削除します。さらにその下にある、変換後のファイル出力に対して指定を行います。変換ファイルの吐き出し場所と画像形式です。

pdf_change17.jpg

 

フォルダーの追加ボタンを押下し、先程PDFから吐き出した画像フォルダを選択すると、画像のように全てのファイルが選択されます。形式はjpgeではなくTIFFを指定します(下記で、モノクロ2進法変換を指定するので、吐き出されるTIFFは白黒モードの1ビットになります)。

pdf_change18.jpg



次に、「変形」のタブをクリックして、指定した画像に対して先程調べた、コントラストなどの指定を行います。

pdf_change19.jpg

左側のコマンドリスト内から下記の順番で、コマンドの指定を行います。

サイズ変更 幅・高さ共に200%(固縦横率) リサンプル Lanczos
コントラスト 45
ガンマ 0.44
グレースケール 64
グレースケール 32
グレースケール 16
グレースケール 8
グレースケール 4
モノクロ2進法変換 ディザなし
DPI設定 X/Y共に600
※コントラスト、ガンマはお好みで調整してください。

300dpiから600dpiへの拡大とグレースケール減色を何度も適応する理由
jpgeのグレースケールモードは、白から黒まで色の変化を256段階(256色)で、表現されています。

この256段階から白黒の2段階(2色)へ一気に変換すると、黒か白か微妙な色の情報を捨てることになり、文字のかすれ原因になります。


pdf_change20.jpg

上記の画像では、「自」など文字で、違いがあらわれてまいす。そこで、256→64→32・・・と徐々に減色させることで、なるべく画像情報を残すように工夫します。

また、はじめに解像度を上げてから減色を行うことで、減色時の画像情報欠落を画素で補っています。

もし、今後同じように画像を濃くする作業を行う場合は、スクリプトの項目で名前を付けて保存をすると次回からこの入力作業しなくて済みます(次回はスクリプト欄から今付けた名前を選択するだけでコントラストなど各数値が呼び出せる)。

ちなみに、コマンドリスト内には画像のトリミング機能などもあるので、興味ある方は検証してみてください。

pdf_change11.jpg

変換は最近のパソコンでしたら1~2分程度で終わります。


c.変換した白黒の画像確認を行います
先程指定した変換後のファイル保存場所に、変換した画像が出来てますので画像を確認します。

図や写真が含むページでは微妙に濃い・薄いなどが出てくる場合がありますので、そのようの画像は個別で手動で調整しなおします。

 

3.PDFに戻します
※ acrobatで、白黒のTIFFファイルをPDFに変換するとき、内部で保存する圧縮形式をCCITT Group4とJBIG2から選べます。ここではCCITT Group4の方をお勧めします(scansnapでスキャンした白黒モードもこちらです)。

両者を比較するとJBIG2の方が圧縮率が高い(約1割程度)のですが、acrobarやReaderで表示した場合、CCITTと比べるとワンテンポ遅れて表示されるので、少しストレスを感じると思います(憶測ですが、JBIG2の方が圧縮率が高い分、展開に時間が掛かっていると思われます)。

内部保存圧縮形式の変更は、メニューバーの「編集→環境設定→PDFへの変換→TIFF→設定を編集→白黒」から可能です。


Acrobatのメニューバーから「ファイル→結合→ファイルを単一のPDFに結合→ファイルを追加(→フォルダを追加)」で結合します。

pdf_change12.jpg

 

先程の画像があるフォルダを指定します。

pdf_change13.jpg

 

デフォルトでは、画像1枚毎にファイル名をしおりとして入る設定になっているので、邪魔だと思う人は、「オプションボタン→常にPDFファイルにしおりを追加する」のチェックを外すといいと思います。

pdf_change14.jpg
(画像を別記事から流用のためjpgになってますが本来はTIFFです。下記同様)

 

このような感じで変換されます。大体1ページ0.5秒程度の速度で変換されます。

pdf_change15.jpg

 

これで、グレースケールから白黒への変換が完了です。後は名前を付けてPDFを保存して完了です。

pdf_change16.jpg

なお、この方法で制作したPDFはScanSnap Organizerでは読み込みができませんが、下記方法で変換すると読めるようになります。

ScanSnap Organizer以外で制作したPDFを読み込む方法

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

PDFの余白を削除・切り取り・トリミングして調整

ScanSnap iX500、S1500、S1300で、本の電子化・自炊したするときに、スキャン・読み取る時に予め余白を切断してもいいんですが手間が掛かります。

そこで、Acrobatで余白を切り取り、トリミングする方法について書いてみます。


1.余白をトリミングして消したいPDFをacrobatで開く
トリミングしたいPDFをAcrobatで開く

結構余白が目立つ本です。表示しているモニタが小さめだと、この余白の部分はぜひ削除して調整したい部分です。

 


2.メニューバーの「文章→ページのトリミング」を選択
メニューバーの「文章→ページのトリミング」を選択

 


3.トリミング・切り取りたい範囲を指定して調整する。
トリミング・切り取りたい範囲を指定して調整

余白の制御の箇所の数字を指定すると、右側のプレビュー画面に余白を消す範囲がリアルタイムに反映されるのでこちらを目安に調整します。

また、奇数・偶数ページと、指定ページのみなどの選択が可能なので、トップの表紙はトリミングせず本文ページのみ指定が可能です。また必要であれば、カットした範囲の復帰も可能です。

 


4.これで余白・トリミングの調整が完了
Acrobat-PDF08d.jpg

これで綺麗に余白が削除されトリミングが出来ました。

 


本を電子化(自炊)したPDFのトリミングについて

本を裁断したデータの余白をトリミングする時に、裁断側の余白が短くなるため、見開き表示の時は、中央と外側で余白の長さが違ってきます。

また単一表示では、奇数と偶数ページで余白の長さに違いがでるのでページ送りをする度に文章の表示位置がずれて落ち着きません。

裁断側の余白が短くなる

そこで、左・右のページを別々にトリミングを行うことで、均等に余白を取り除けます。まず、ページ番号がわかりやすいように、サムネイル表示を行います。

 

Acrobatのナビ表示の仕方 

空きスペースで右クリックをしてメニューから「ナビゲーションボタンの表示」をクリックします。

 

Acrobat サムネイル表示

左側にナビゲーションボタンが表示されるので、一番上の白いアイコンをクリックするとサムネイルが表示されます。

サムネイルの下にある数字がページ番号です。ここからトリミングを行う、本文の開始と終わりのページ数を調べます。

また、現在表示しているページが偶数か奇数なのかも確認します。

ブログの画像表示範囲の関係上、以下はサムネイルを非表示で作業しています。

奇数側のページを指定

まず、奇数側のページのトリミング指定を行います。先程調べた、本文の先頭ページと終了ページ番号を「開始ページの欄」に入力して適応先を「奇数ページのみ」を選びます。

OKボタンを押す前に、トリミング範囲をメモします。メモに携帯のカメラを使うと便利です。暗記できる人は暗記で。

携帯カメラでトリミング範囲メモ

 

偶数側の指定

先程の同じ要領で数字を入力していきます。トリミング範囲は先程の同じですが、左右の数字のみ入れ替えます。適応先を「偶数ページのみ」を選びます。

 

pdfを綺麗にトリミングできました

これで、左右均等にトリミングが出来ました。

 

ちなみに、ipadなどの端末で見る場合、縦長のディスプレイになるので、横の余白幅はそれ程気にしなくていいようです。

最近は、横幅のトリミングは中央に合わせて「偶数および奇数のページ」を選択して一括でトリミングしています。

本の電子化で、手間かかり過ぎると嫌になってしまいますのでなるべくいい意味で手抜きを心がけています。

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

次回Acrobat/Reader起動時にPDFを終了したページから表示するレジューム設定

ScanSnap iX500、S1500で本の電子化・自炊したPDFの本を読んでいると、最後に開いたページを次回起動時に表示してくれるレジューム機能のようなものがあると便利です。

そこで、今回はこの設定方法について説明します。

1.Acrobat/Adobe readerを起動してメニューバーの「編集→環境設定」を選択

Acrobat-PDF07a.jpg

 

2.文章の項目を選択して、開き方の設定「文章を再び開くときに前回のビュー設定を復元」を選択
Acrobat-PDF07b.jpg

これで、以前終了したページから開くようになります。ただしPDFファイルを移動した場合はこの記憶はリセットされるようです。

つまり以前開いたPDFのページ位置の情報はFDP側ではなくAcrobar側で記憶しているようなので、ファイルを移動してしまうと別のFDPとして認識されてしまうようです。

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

PDFで見開き(左右逆)設定をする

ScanSnap iX500、S1500で本の電子化・自炊してPDFで保存した時に、デフォルトでは左綴じになっていますので、右綴じの本では左右逆に表示されてしまいます。

そこでAcrobatで、見開きの時に綴じる方法の設定を行います。

 

1.該当PDFをacrobarで開きます
Acrobat PDF見開き設定

PDFは左綴じがデフォルトなので、見開き表示をした時に、右綴じの本の場合、左右逆になってします。通常ページ番号が外側にあるのに対し中央に来ている。

 

2.ページ内で右クリックをし「文章のプロパティ」を選択
Acrobat PDF見開き設定プロパティ

 

3.詳細設定のタブ→読み上げオプションの綴じ方で、右を指定
Acrobat PDF見開き詳細設定

 

4.ついでに開き方のタブで、PDFを開いた時の動作も指定できる
Acrobat PDF開き方

大きいモニタを使っている人は、見開きでもいいかもしれません。

 

5.これで見開き時、右綴じになりました
Acrobat PDF見開き設定完了

ページ番号が正しく外側になっています。

 

Acrobatを持っていない人はフリーソフトで対応できそうです。

vectorサイトより

RightFile
http://www.vector.co.jp/soft/win95/writing/se324457.html

PureRose ~ピュアロセ~
http://www.vector.co.jp/soft/win95/writing/se451571.html

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

PDFの色が薄い文字(本・書類をスキャンした)画像を濃くする

scansnapなどでスキャンした本・書類をPDFにした場合*、グレースケール・フルカラーなどでは、薄く読み取られ、文字が読みにくい場合があります。

*これは複数の画像がPDFというひとつの袋に入っているイメージです。

特に自炊をして、もうどこでも本が読めて部屋も広くなる!と思っていたのにいざscansnapで電子化したら画像が薄くて不満だって方は悲しすぎます。

そこで、その薄くて読みにくいPDFやscansnapで読み取ったデータを一括で濃くする方法を試しましたのでメモとして記載します。

pdf_change01.jpg

画像の右側の薄いPDFがscansnapのグレースケールくっきりモードで読み取った画像で、左側が変換後の濃くした画像です。


下記に詳しく書きますが、流れとしては「PDFから画像に一度戻し、画像ソフトで濃さを調整して、再びPDFに戻す」という手順*です。

*カラー・グレースケールで、薄くスキャンされてしまうことがあらかじめ予想される場合は、スキャン時に初めからjpeg出力しておくとPDFから画像の変換作業が省けて便利です。


1.PDFから画像データの吐き出し
Adobe Acrobat(上位機種のscansnapには付属されています)をお持ちの方は下記の方法で吐き出せます。

対象PDFをAcrobatで開き、メニューバーから「ファイル→書き出し→画像→jpeg」で吐き出します。

PDFから画像データの吐き出し

 

ファイル保存先を指定したら、「保存」ボタンを押します。するとPDFのページ分一気に画像が書き出されます。

PDFから画像データの吐き出し



2.画像ソフトで画像を濃くします
画像ソフトなんでもいいのですが、「コントラスト、明るさなど」の調整、バッチ処理(複数の画像ファイルに対して明るさなど変更する作業を自動で行ってくれる機能)が出来ることを考えると、有料ではPhotoshop/Fireworks、フリーソフトではXnViewあたりがいいと思います。ここではフリーソフトのXnView*で話を進めます。

* XnViewについては下記サイトを参考ください。
窓の杜 XnView
http://www.forest.impress.co.jp/lib/pic/piccam/picviewer/xnview.html

Wikipedia XnView
http://ja.wikipedia.org/wiki/XnView

 

a.まず、自分の好みの濃さを求めます

XnViewを起動するとファイル選択画面になるので、先程吐き出した画像フォルダを選択し、どれか画像をクリックします。

pdf_change04.jpg

 

選択した画像が大きく表示されます。このモードで、メニューバーの「画像→修正→明るさ/コントラスト/ガンマ/カラーバランス」を選択します。

pdf_change05.jpg

 

画像修正パネルが出ますので、コントラスト、ガンマなどをいじって自分の好みの濃さを割り出し、各数字をメモします。各数字をいじると、リアルタイムで画像が反映されますので、画像を見ながらいじるといいと思います。

pdf_change06.jpg

この例では、明るさを0、コントラストを9、ガンマ修整を0.48で指定。

メモをしたらキャンセルで閉じて、上のタブをダブルクリックするとさらにこの編集画面が閉じられ起動時の画面に戻ります。

 

b.全ての画像に対して濃さを変更します
一枚ごとに先程の濃さの変更は大変なので、全ての画像に対して指定した濃さの変更を自動で行います(Photoshop/Fireworksではバッチ/コマンド処理というものです)。

メニューバーの「ツール→一括変換」を選択します。
pdf_change07.jpg

 

先程開いたファイルがひとつリストに入ってしまっていると思うので、ある場合は一度削除します。さらにその下にある、変換後のファイル出力先と、出力するファイル形式(jpegを指定)の指定を行います。

pdf_change08.jpg

 

フォルダーの追加ボタンを押下し、先程PDFから吐き出した画像フォルダを選択すると、画像のように全てのファイルが選択されます。

pdf_change09.jpg


次に、「変形」のタブをクリックして、指定した画像に対して先程調べた明るさ、コントラストの指定を行います。

pdf_change10.jpg

左側のコマンドリスト内のマップの項目にコントラスト、ガンマの項目があるので、項目を選択し追加を押すと、右側の実行リストに追加されるので、パラメーターに先程メモした数値を入力します。

もし、今後同じように画像を濃くする作業を行う場合は、スクリプトの項目で保存ボタンを押すと次回からこの入力作業しなくて済みます(次回はスクリプト欄から今付けた名前を選択するだけでコントラストなど各数値が呼び出せる)。

ちなみに、コマンドリスト内には画像のトリミング機能などもあるので、興味ある方は検証してみてください。

pdf_change11.jpg

変換は最近のパソコンでしたら1~2分程度で終わります。


c.濃さを変更した画像の確認を行います
先程指定した変換後のファイル保存場所に変換した画像が出来てますので、画像を確認します。

図や写真が含むページでは微妙に濃い・薄いなどが出てくる場合がありますので、そのようの画像は個別で手動で調整しなおします。

 

3.PDFに戻します

Acrobatのメニューバーから「ファイル→結合→ファイルを単一のPDFに結合→ファイルを追加(→フォルダを追加)」で結合します。

pdf_change12.jpg

 

フォルダの追加を選択します。

pdf_change13.jpg

 

フォルダにある画像がすべて読み込まれました。デフォルトでは、画像1枚毎のファイル名がしおりとして入る設定になっているので、邪魔だと思う人は、「オプションボタン→常にPDFファイルにしおりを追加する」のチェックを外すといいと思います。

pdf_change14.jpg

 

こんな感じで変換されます。大体1ページ0.5秒程度の速度で変換されます。

pdf_change15.jpg

 

これで、薄い文字(スキャン画像)のPDFが濃くなって見やすくなります。後は、必要に応じてOCRをかけて文字認識をさせPDFを保存して完了です。

pdf_change16.jpg

なお、この方法で制作したPDFはScanSnap Organizerでは読み込みができませんが、下記方法で変換すると読めるようになります。

ScanSnap Organizer以外で制作したPDFを読み込む方法

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ

 
 

 

PDFが扱える画像形式の圧縮種類

ScanSnap iX500、S1500に付属のAdobe Acrobat、ReaderのPDFデータに含まれている画像形式データがどのような圧縮の種類で保存されているか、できるのか調べてみました。

はじめはネットで調べてみましたが、それらしい情報が見つからず困りましが、ふとAcrobatの環境設定内のPDFへの変換項目を見たら画像からPDFへ変換する際にどの画像形式で保存するかの設定がありました。



Acrobat 画像変換設定画面

というわけで下記がPDFで扱える画像形式です。

 

白黒(単色)
CCITT Group4/JBIG2(劣化なし/劣化あり)

グレースケール
ZIP/JPEG(最低/低/中/高/最高)/JPEG2000(最低/低/中/高/最高/劣化なし)

カラー
グレースケールと同じ。

その他にGIFも扱えるようです。Acrobatで画像からPDFへ変換する際、GIF画像はそのまま取り込まれるみたいです(データの読み込み・書き出しのファイルサイズからのあくまで想像です)。

このGIF画像の利用法として、例えば4色カラーの文字中心の本を、カラーの表示も残してスキャンした場合、通常JPEGを選択することになりますが、後からJPGE→GIF変換→PDFにするとこで劣化がなくデータサイズを小さくしたPDFが作ることが出来ます。

グレースケール時のJPEG(8bit)についてですが、JPEGはグレースケール8ビットの指定が出来るのでAcrobat/scansnapグレースケース読み取り時には、このモードで保存されています(今までJPEGはフルカラーのみの形式だと思ってました)。

白黒のデータ形式についてですが、PDFは、CCITT Group4とJBIG2(劣化なし/劣化あり)から選べます。それぞれについての特徴は下記の通りです。

 

CCITT Group4
Faxで使われている圧縮形式で、データ量がJBIG2より1割り程度多くなる傾向があるがAcrobat/Readerでページをめくる時にタイムラグなく素早く表示できます。


JBIG2(劣化なし/劣化あり)
CCITTよりも圧縮率が高い。しかしAcrobat/Readerでページめくる時にワンテンポ遅れて表示され、特に見開きでマウスのホイールで次々ページ送りをすると表示にタイムラグが生じ若干ストレスを感じます(PCスペック WinXp Pentium DC E5200 MEM2GB)。マシンスペックから考えると圧縮率が高いので処理が追いついていないということではないとは思うんですが…

この〝ワンテンポ遅れて表示〟されることがやや気になるので、白黒の画像をPDFにする際は、データ量の節約よりも素早く表示されることを優先しCCITTで保存しています。

因みにScanSnapの白黒モードでスキャンした場合はCCITTの方で保存されているようです。

 

参考サイト
Adobeサポートページ
PDF 変換時に画像圧縮率を設定することはできますか
http://kb2.adobe.com/jp/cps/409/4099.html

 

関連記事

ico_arrow26r_1.gifScanSnap・iPadで本を電子化する24のテクニックまとめ