こんにちは, 株式会社ECナビ システム本部の春山(@haruyama)です.

KindleやiPadの登場によって, 紙の本をスキャンしてPDF化する(いわゆる自炊)が盛り上っています. 私も今年ScanSnap SI1500とPL-513Lを購入し, 日々本を裁断してはスキャンしています. スキャンした本はPCやNetWalker(PC-Z1)で閲覧しています.

pc-z1

写真では画面を横断する線が入ってますが実際には見えません.

スキャン設定

主に技術書と漫画をスキャンしていて, すべての本に対して以下の設定を利用しています.

画質
スーパーファイン
カラーモードの選択
カラー高圧縮
読み取り面の選択
両面読み取り
ファイル形式
PDF
圧縮率
5(最大)
その他
  • 白紙のページは自動削除
  • 検索可能なPDFにはしない(技術書はあとでしています)
  • カバーはスキャンしていません.
  • 表紙はスキャンする意味のある場合にスキャンしています.
  • マルチフィード検出: 重なりで検出(超音波)

他の方の設定例: ScanSnap S1500 の設定まとめ - 電子書籍を自炊するときの 10 のポイント - 彼女からは、おいちゃんと呼ばれています

カラーモードの選択を「自動」にしていないのは, 漫画のスキャン時に白黒とカラーがいりまじることがあったからです.

マルチフィード検出は, 文庫本などではそれなりに失敗します. スキャン前に原稿の枚数を数えておいてスキャン後に確認し, 枚数が違ったらマルチフィードを見付けてその部分をパッチしています.

漫画のカバーは保存しています(写真はその一部です).

manga_cover

ScanSnap Organizerには技術書と漫画が雑然と並んでいます. 技術書のOCRの間に漫画をスキャンすることが多いからです.

scanscanp_orgnizer

「濃い」漫画「薄い」漫画

こうして作成した190冊の漫画PDFについて, ファイルサイズをページ数で割ったものを計算したデータ(mangapdf_20100824.tsv)を作りました. ファイルサイズ/ページ数が大きいほど「濃い」漫画, 小さいほど「薄い」漫画と呼ぶこととします. なお, ここで挙げている漫画はすべて好きな漫画です. 私は「濃い」漫画も「薄い」漫画もそうでない漫画もすべて好きです. 「濃い」「薄い」は絵柄などの情報量の違いを表す表現です.

ここでは私が持っている漫画のうち「濃い」「薄い」それぞれベスト5を紹介します.

「薄い」漫画ベスト5

まずは「薄い」ほうから.

「薄い」漫画ベスト5
順位漫画漫画家(敬称略)サイズ(kB)/ページ数
1かいしゃいんのメロディー大橋 ツヨシ24
2サカモト山上 たつひこ38
3水木しげる 恐怖貸本名作選 墓をほる男・手袋の怪水木 しげる51
412月生まれの少年施川 ユウキ52
5水木しげる 魍魎貸本名作選 地獄・地底の足音水木 しげる64

圧倒的な強さで「かいしゃいんのメロディー」がベスト1に輝きました. 他にも4コマ系が順当に上位に入っています.

貸本時代の水木しげる先生もランクイン. 「薄い」感じにはみえないのですが...

「濃い」漫画ベスト5

そして「濃い」ほうです.

「濃い」漫画ベスト5
順位漫画漫画家(敬称略)サイズ(kB)/ページ数
1へうげもの山田 芳裕343
2アスカ@未来系島本 和彦280
3ゲキトウ島本 和彦270
4ジャイアントキリングツジトモ248
5涼宮ハルヒちゃんの憂鬱ぷよ242

「へうげもの」が2位に大差を付けました. 山田 芳裕先生の「濃さ」に勝てる漫画はなかなかなさそうです.

2,3位は島本 和彦先生の作品が入りました. 島本先生の作品はスキャンした数が多いので, サイズ/ページ数をながめてみるとなかなかおもしろいです. というわけで次回は島本 和彦先生の漫画の作品ごとの「濃さ」を考察します!Happy Scaning(2): 島本和彦漫画の「濃度」の研究に続く!