2010年3月10日水曜日

ScanSnapで書籍電子化

ネットでさんざんやられてる、ScanSnapとPK-513Lの組み合わせでの書籍電子化についに手を出してみました。

ScanSnap S1500


こちらが、電子書籍化の要。「ScanSnap S1500」
切り刻んだ書籍をプリンタみたいに次々1ページづつ読み込んで両面スキャンをしてpdfやらjpeg化してくれるモノ。ページの多重読み込みの検知は代を重ねるごとに進化していて「超音波方式マルチフィードセンサー」なるカコイイ名前の機能でバッチリ検知してくれる優れもの。まず間違いない感じ。
逆に、セットした紙を間違って2枚同時に読み込んだりすることの方は2000枚に1枚ぐらいの感じ。もちろん超音波方式マルチフィードセンサァァーーッ!が検知してくれるのでバッチリ。
むしろ間違って2枚読まれるときは、その2枚はなんらかつながっている時の方が多い。ちゃんと裁断されずにノリが残っててつながってるとか、端っこが折れ曲がっててひっついてるとか・・・



PK-513L


そして、こっちが本を裁断するのに使う裁断機。かなり本格的な感じ。場所も重量もあるので狭いところで作業するのには向いてないかも。ただ、驚くほどよく切れる。作業は独りでやるのにしないと怖い。餅つきみたいに二人でやると事故が起きる予感。



作業の流れ

まずは裁断。普通のマンガぐらいの厚さなら1発で裁断できる。
厚めの本のケースは一度真ん中あたりでバリバリって見開いて

カッターで真っ二つに。ここの裁断部分は最終的にはざっくり切断される所なので適当でOK。

裁断機にセット。PK-513LはPK-513に比べてライトがLED化されたらしく(LはLEDのLか?)裁断のガイドラインが見やすくなったとのこと。コレを目安に端から5mmぐらいのところを裁断。
あまりギリギリの所をやるとノリが残ってしまってつながってるページを手動で切り離してやらなくちゃいけなくて面倒。かといって大幅にざっくりと切ってしまうと、今度は読みたい部分が切れてしまったり・・・
この辺は、この本をどれぐらいちゃんと処理したいかによってかわりそう。5mmを標準として見開きを綺麗にやりたいなら3mm~4mmで丁寧にページが分かれてるか手動チェックをする。
逆にいつか読むかもしれないけどとりあえず処分したい。みたいなどうでもいい本は8mmぐらいのところで切って、手動チェックは適当にボンボン流れ作業のようにスキャンするのがいいかも。

裁断されるとこんな感じになる。この状態でバラバラっと本を落としてしまうと大変なことになるので注意w
切断された本はちゃんと綺麗にページが分かれてるかパラパラっとめくってチェック。特に気を付けたいのが最初の表紙と最後の裏表紙。この2箇所がそれぞれ最初のページと最後のページとつながってるケースが多い。要チェック。
あとは、手で触ってみるとページが切れてない所は固い感触があるのでわかるとおもう。
5mmぐらいで切った場合は表紙、裏表紙、パラパラっとめくって真ん中、上端、下端と全部で5箇所を5秒ずつぐらいかけてチェックすればだいたいOKだと思う。

チェックが終わったらScanSnapにセット。あまりたくさん積みすぎると紙が重さで押されて読み込めないことが多いみたいなので、半分ずつぐらいセットするのが良さそう。
継続読取をONにしておいて全部終わってから残りを追加してもいいし、慣れてくればある程度読み込まれたところで追加分を載せてやってもいい。

表紙の扱い

最後に問題になるのがカラー表紙の扱い。これが結構面倒。
普通に読み込ませると両面+作者のコメントやらの入れられてる部分と横に長すぎて途中で途切れてしまう。
かといって、表と裏で別々に読み込ませるために切断して・・・ってやるのは面倒すぎる。
幾つか試してみたので、自分に合うパターンを見つけるといいかも。

途中で切れてしまうのは気にしない
最後の方が少し切れるだけなので、だいたいそこにはその作者の書いてあるほかの本のリストだったり宣伝が多いし別に気にしなくてもいいか?という感じでバンバンスキャンしてしまう。
でもまぁ、こういう電子書籍化をするような人はそういうところも気にする人が多いと思うので、なんとなく嫌なんじゃないかなぁ

切断して表面、裏面と別々にスキャン
これが一番手間がかかるけど綺麗に行くものだと思う。
ただ、切断が面倒だったり、スキャンしたあとpdfを編集したりとなにしろ面倒なことが多い。
大量の書籍をやろうとしている人には向かないかも?そして、こんなことする人はきっと大量の書籍をやるんだよねw

A3キャリアシートを使って両面スキャン
ScanSnapにはA3キャリアシートっていう便利なものがついてて、このシートに二つ折りにしたモノを挟むと両面スキャンした上で両サイドを繋げた形のデータとして取り込んでくれるという優れもの。
コレを利用して、表紙を半分に折って取り込む。
コレはいい感じなんだけど問題があって、表紙が多数の場所で折れ曲がってるのでキャリアシートにピタっと収まらず浮いてしまって綺麗にスキャンできない。
綺麗に折れればいいんだけどなかなかねぇ。
そんなわけで、折ったところを切断してセットすると多少ましになるかも?って試したけど、これは前の案と同じで面倒すぎる・・・

表紙を折ってそのままスキャン
結局落ち着いたのがこの方式。表紙を半分に折って、折り目の方を下にしてScanSnapにセットしてスキャン。
読み込むと2重読み込みの警告が出るけど無視して取り込み。取り込んでから、縦横の向きを補正という流れ。コレならいちいち切断しなくて済むので便利。
大量に処理するときはとりあえず中の本だけ次々取り込んでしまってから、表紙をまとめて取り込んで、ScanSnap付属のソフトで回転補正をしてpdfに切り貼りをする感じ。コレぐらいの手間が落とし所かなぁ
ちなみに、きっちり折ってやらないとうまく読み込めないし、どっちを表にするかで読み込んでくれなかったりもして結構微妙なコツが要るw
あと、2枚読み込んでいるせいか表面が空回りして表紙がビローンって伸びてスキャンされてしまうこともあるので注意。

長尺スキャンモード
2010-05-27追記
ブログのコメントで匿名さんに長尺スキャンモードなるものがあることを教えてもらいました。
これ・・・なんで気づかなかったんだろうorz
表紙を折りたたまずにそのままセットして、スキャンボタンを長押し。スキャンボタンが点滅を始めてからはなすと「長尺スキャンモード」になります。
これなら、長い帯でも表紙でもバンバン取り込める。すばらしい。と同時に、今まで苦労はいったいorz
ソフトの方の設定でカスタムサイズにして伸ばして見たりとかいろいろしたけどうまくいかなくて、このスキャナの最長スキャンサイズは表紙が取り込めるほどはないんだなーと思い込んでしまったのが敗因

匿名の通りすがりのS1500ユーザーさん、ありがとう!

スキャン後のデータの扱い

とりあえず、全部pdfで保持してる。表紙はさっきみたいに取り込んだ後、表のページだけをコピーして背表紙を含めたところまでトリミングして1ページ目にしてやると、pdfのサムネイルが並んだ時にいい感じ。
背表紙を含めてるのは、そこに何巻って情報があるので一覧で見るときに便利だから。

データ閲覧

閲覧するデバイスとしてiPod touchにGoodReaderを入れて試してみた。GoodReaderは噂通り安いのにすごく性能の良いソフトだった・・・が、物理的にあの画面では狭すぎる。
ラノベもすごく頑張れば読めるけど疲れる。拡大してみるとスクロールが面倒。
マンガはラノベに比べてページサイズが大きいので相対的に文字が小さくなって辛い。
横にして縦スクロールしながら読めば、まぁいけるかな~という感じ。NetWalkerとかpdfが読める小型PCを使う方がいいかもしれない。
iPadは期待してるが、持ち歩くには大きいかなぁ~ あの半分のサイズがいいんだけどねぇ
DELLが出すというAndroidマシンがちょうどそれぐらいのサイズで良さそうに見える。これ日本で買えるのかな?

最後に細かいポイント

ScanSnapのモード
スーパーファイン(300dpi)の両面カラー

白紙スキップはOFF
理由はページのカウントが面倒になるから。
確認後に手動で消すなら消すし、見開きモードで閲覧してるときに白紙ページが入ってて1ページずれると
その後が全部ずれちゃうとかいろいろ問題があるので、基本は残してる。

回転補正もOFF
これをONにしておくとページ見ながら補正されちゃったのを戻さないといけないとか逆に面倒なだけ。裁断して向きがきれいにそろってるなら回転補正を使う必要はない。

掃除
1000枚とか読み込むとさすがに機械の中が汚れてくる。エアダスター的なものを用意してこまめに吹き飛ばしてやるとよさげ。(追記:説明書にこれをやってはダメと書いてありましたorz ただ、気づかずにもう6万枚近くエアダスターでごみを吹き飛ばしながら使ってますが、今のところ大丈夫です)あと、シールをはがした後の粘着している状態のものをスキャンするとスキャン面が汚れて赤とかの色のついた線がダーーーっと残るようになってしまうので注意。
そうなったら、スキャンしてる透明なプラスチックのところを綺麗に拭いてあげよう。

緊急停止
一番手っ取り早いのがScanSnapのカバーを開ける。主に2重読取をしてしまったときに、結構引っ張る力が強くて紙がバリバリ破けてしまうことがある。そういうのに気づけたらカバーを開けて読み込みを止めてやるといい。
ちゃんと裁断されてるか不安な物とか、これはミスしたくないと思ってる物に関してはケースをあけるところに指をかけて待機しておいて。なんか異常を感じたらすぐに開けられるようにしておくといいかも。

PCの負荷
実は圧縮に結構負荷がかかる。二重読み込みのトラブル時等にそのスキャンデータを残すとか、読み込みを中断するとかの選択はPC側にでるので、その選択をするために圧縮が終わってないと待ってあげないといけない。ショボイノートPCでとりあえず取り込んで~とか考えてるならちょっと考えた方がいいかもしれない。
次のページの読み込み開始までのタイムラグが意外と出てしまうかもしれない。

ホチキスに要注意
裁断するときはホチキスの針に要注意。これを間違って裁断機で裁断してしまうと確実に刃こぼれがおきる。
裁断面にホチキスの幅ぐらいの傷が常につくようになってしまうし、取り返しがつかない。
取り替えようの刃は1万円以上するし気をつけるに越したことはない。
確実にホチキスの所から離れたところを裁断するから大丈夫って思ってても、裁断する際にずれてやっちまうことがあるので気を付けた方がいい。私はこのパターンで1回やってしまった。
幸い、スキャンに影響が出るほどの問題はでてないけど、同じところを2度3度とやっちまうと最後のページが切断されなかったり、裁断面が変に前のページとひっついてしまったりとか起きそうで怖い

5 件のコメント:

匿名 さんのコメント...

通りすがりのS1500ユーザーです。
表紙などの長尺原稿を読み取るときは、Scanボタンを長押しすることで長尺読取モードに入ることができますよ。

Chishow さんのコメント...

なんと!?まじですか
これ知らなかった・・・後で試してみます!

うまくいったら、エントリーを修正しておこう

匿名 さんのコメント...

エアダスターで吹き付けるのは、ホコリを内部に押し込んでしまうからダメと取説に書いてあります。

Chishow さんのコメント...

これまた親切にありがとうございます。
説明書、しっかり読んでないのがバレバレですねorz
エントリーを修正しておきました。

カットブックプロ さんのコメント...

はじめまして、業界再安価の書籍裁断サービスのカットブックプロと申します。
事後報告で恐縮ですが今回サイトから自炊方法の紹介としてリンクを張らせていただきました。

今後さらに手軽に利用出来るよう価格やサービスの改良を怠らず努力してまいりますので今後ともよろしくお願いいたします。