ScanSnapとAcrobatの使用レポート　その２ - トアル電算室ノ業務日誌

前回に引き続き。。。カラーだとこんな感じでした。

■実験３
主にカラーを。
カラーPDFは「6.0以降縮小」でどれだけ小さくなるかやってみる。

実験3-1
表紙とその裏面　（※サンプル1）
カラーノーマル　373KB　->　328KB
カラーファイン　606KB　->　565KB
カラースーパーファイン　1570KB　->　790KB

実験3-2
割と文字の多い2ページ（※サンプル2）
カラーノーマル　485KB　->　382KB
カラーファイン　793KB　->　642KB
カラースーパーファイン　1653KB　->　463KB

おっと、縮小後にファインとスーパーファインでサイズが逆転してしまっている。

やっぱりカラーでも、前回の白黒に引き続きScanSnapはノーマルからスーパーファインまで取込み速度に関しては殆ど優劣が無いから、カラー＋スーパーファインでいったん取込んでおき後で縮小を掛けるっていうのが現実的な解かなあ。

ちなみにエクセレント（カラーグレー600dpi/白黒1200dpi）は時間が掛かりすぎる（B5で1枚10秒とか）のでテストもしてませんよ。

■サンプル1　表紙とその裏面

■サンプル2　カラーでなおかつ割と文字の多い2ページ。

↑もう1ページの方もだいたいこんな感じ。

カラーノーマル↓

カラーファイン↓　

カラースーパーファイン↓

カラーノーマル＋「Acrobat9.0およびそれ以降」で縮小↓

カラーファイン＋「Acrobat9.0およびそれ以降」で縮小↓

カラースーパーファイン＋「Acrobat9.0およびそれ以降」で縮小↓

■実験4
文字の解析（OCR作業みたいなやつ、つまり検索を有効にするための処理）

先ほどのカラースーパーファインのファイル（割と文字の多い2ページ）を使って以下のテストを行う。

１　文字解析して縮小
オリジナルサイズ1653KB　->文字解析->365KB->9.0以降の縮小->331KB

２縮小して文字解析
オリジナル1653KB　->9.0以降の縮小->463KB->文字解析->346KB

１のやり方つまり画質を縮小で落とす前に文字解析するという手順の方がレゾリューションの細かい画像から文字認識しようとするのだから文字認識率が高いことが期待できる。そのうえ微妙だけどサイズも小さくなるのだからこれならまず解析してから縮小した方がいいことづくめではないか。。。今回サンプルに選んだページでやるとたまたまこうなるだけってこともあるので過信は出来ないけどね。

■まとめ■
今のところのBest Practiceっていうか、とりあえず深いこと考えずにScanSnapとAcrobatでPDF化するとすればこんな風になると思う。

基本　スーパーファインで取込む（カラーが欲しいところはカラー、他は白黒）。
↓
PDFになったら文字解析（検索可能）にする。
↓
次に縮小を掛ける。ただし画質を落としたくないたぐいのものは縮小しない。