TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
日垣隆★121★korian
【凸版系】BookLive! part6
自炊技術総合15 @電子書籍板
Kindle セール情報 part55
電子書籍板・自治スレ1
Audible.co.jpスレ Part.4
【Yahoo!】eBookJapan 49冊目【ebj】
booklive社内事情専用スレッドpart1
【楽天】Kobo 総合 89冊目【コボ】
【KADOKAWA】BOOK☆WALKER 103冊目

【ChainLP】自炊データ変換ソフト【PDFDiet】4冊目


1 :2013/06/12 〜 最終レス :2020/05/15
自炊したデータやテキストを変換し、電子書籍リーダで読みやすくデータを最適化するソフトのスレです。
・ChainLP
自炊データ変換界の大御所
http://no722.cocolog-nifty.com/blog/chainlp/
・かんたんPDFDiet
シンプルな余白削除、フォーマット変換なら。SonyReader との相性抜群?
http://smart-pda.net/software/PDFDietEasy/
自炊でないデータ変換(AozoraEpub3など)についてはこちらへ
【自主】電子書籍作成スレ【作成】
http://uni.2ch.sc/test/read.cgi/ebooks/1297947557/
■前スレ
【ChainLP】自炊データ変換ソフト【PDFDiet】3冊目
http://uni.2ch.sc/test/read.cgi/ebooks/1330112414/

2 :
落ちていたので立ててみた
引き続き、どうぞ

3 :
>>1
おつ

4 :
>>1
スレたてご苦労

5 :
となりのヤングジャンプ、裏サンデーなどのWEBコミックや、立ち読み、試し読み まとめサイト
http://freecomic.biz/

6 :
>>1
立ててくれてありがとう、前スレいつの間にか落ちてんだもんな
よそのスレで質問していたよ

7 :
PDFDietの特殊な起動方法はなんとかならんのか

8 :
ChainLPで作成したmobiデータがNexus7だと落ちるんだけど・・・・・
PWは問題なんだけど、同じような症状の人いない?
ChaiLPで出力をMobiにしているだけで他は何もいじってなんだけどな

9 :
これもしかしてOCR無効になる? 余白かっとすると

10 :
はい

11 :
そうか。なかなか上手く行かないもんだな。

12 :
>>9 >>11
その気持ち、分かる。
なんていうか、、、
よく分からない一括おまかせ画像処理とかいらないから、
シンプルに余白カットだけとか、
画像の一部だけゴミ除去とか、
OCRの一部を訂正とか、
他は維持したまま、単純操作をやりたいのだけどそういうPDFのソフトって少ないよね。

13 :
>>12
まあかなり優秀でフリーソフトであることに申し訳と思うようなできではあるんだけどな・・・

14 :
起動方法が普通じゃないのがなー

15 :
>>14
え、なんかあったっけ

16 :
わざわざそれ用にエクスプローラ起動して、D&Dしてる

17 :
>>16
?? 普通にショートカットとかに登録して起動しているけど・・・

18 :
>>9
Yes。Creator が変わるので scansnap で再OCR不可。acrobat 使うしか無いよ。diet の xml 修正裏技は出来なかった。
大丈夫だったのは rightfile ぐらいかな。

19 :
>scansnap で再OCR不可。
出来る方法あると思うが
先頭に1枚追加や差し替えじゃないぞ

20 :
>>8
自分で作ったmobiをAndroidのKindleアプリで表示させると落ちるのって仕様なんじゃ?
俺は自炊本をAndroidで読む時はPerfectViewer使うようにしてる。出力時にzipかrarにしておいて

21 :
>>19
Creatorをscansnapにパッチすればいいんだが、pdfdietだと1文字足りないんだ。

22 :
>>21
BeCyPDFMetaEdit
使ってみて!(^^)!

23 :
自炊画像データ+上のレイヤーに透明OCR文字
のpdfを
画像データ

黒色OCR文字
に分離するのに簡単で最適なソフトってどれ?

24 :
なんだかんだでPDFにはアクロバット

25 :
>>22
TNX from 21

26 :
うい@22

27 :
>>18
えっとプロファイルの setting*.xml の、
<Creator>PFU ScanSnap Organizer 4.1.14</Creator>
にすれば良いんだと思う。
設定できるのにドキュメントに書いてないのは作者が富士通に遠慮してるんだと思う。

28 :
i2pdfで自作したPDFを更にchainLPにD&Dしたところ、そのPDFの1頁だけが本の頁分読み込まれてしまうんだが、これはバグということでいいのかな

29 :
>>27
やってみたけどダメなんだが

30 :
>>27
22 で解決済みです

31 :
chainLP,機能的には不満ないんだけど
処理速度向上させるのは無理だろうか
一括変換ファイルが千超えると2日くらいかかる…w
複数ページ処理させるとうちの環境だと何故かファイルがおかしくなるし

32 :
じゃぁ500で分けて2ファイルにしたらいいのに

33 :
>>31
そりゃ単純にCPU性能が低いんだろ

34 :
>>31
メモリ何メガなんだよ・・・

35 :
sub2.0の外付けHDDでもいいから
保存先を別ドライブにするだけで時間短縮するぞ
usb3.0の”書き込みの速いUSBメモリ”でもいいぞ

36 :
>>35
main2.0 とか USA3.0 じゃ、だめですか?

37 :
>>36
ごめん そういうの解らないんだ

38 :
俺はRAMディスク作ってそこで作業してるな
快適そのもの

39 :
横から悪い
RAMディスクはテンポラリとして?
それとも変換前データを置いておく場所として?

40 :
それは単にソフトのバッファリングが下手なんだよ
普通に作ればHDDで特に遅くはない

41 :
>>39
4GB割り振ってあって、スキャンしたものはそこに保存して補正。
補正後にzip化までしてからHDDに書き出してるよ。

42 :
mobi出力時にKindlestrip.pyを実行する機能を追加されたので使ってみたのですが
出力された時に圧縮前のファイルと圧縮されたファイルが同時に出力されるのですが
どうにか圧縮されたファイルだけ出力出来るようになりませんか?

43 :
小説家になろうのページからD&DでPDFには出来るんだけれど
KindleDX用に2段組設定してると2段組に出来るときと強制的に1段になってしまうときがある?
KindleDXで1段組だと縦に長すぎて見にくいんだよね

44 :
すみません質問です
chainLPで特定の自炊pdfファイルを開くと、
左タブにページは250枚以上全て読み込まれているらしいのですが
中身がなぜか全て同じページになっています
(プレビューも1枚)
自炊業者に頼んだpdfファイルなのですが
数点ありましてなぜかchainLPでepubやcbzに変換したあと全てが特定のページのみとなってしまいます
普通にpdfを読むだけなら破損もなく問題ないのですが…
原因がわかる方いたらご教授願います…

45 :
>>44
応えにはならんが、>>28でも同じ症状が出ている
バグかな

46 :
>>45
あ…本当だ
ありがとうございます
分割するソフトで頁ごとに分けるしかないのでしょうかね…;;

47 :
テキスト文書を横書きのままkoboで読むのはどうすればいいでしょう。
ドロップすると縦書きになってしまうので。

48 :
本体を傾けるってのはどうかな
え?ちょっとした発想の転換てすよ
大したことないですよ

49 :
>>47
AozoraEpub3 で横書き指定の e-pub にすればいいんじゃあ無いのか ?

50 :
>>49
ありがとうございます。思っていたものに近いです。
頑張ってみましたが、58KBのテキストが、38KBになって出来上がり、
全体の三分の一くらいしか書き出されていないorz
どこか間違ってるんでしょうか。

51 :
どっかにこんな感じで半角ハイフンが続いてるところはない?
---------------------------------------
半角ハイフンが連続で続いた行に囲まれた部分がコメント扱いにされて消えてるんだと思う

52 :
>>51
親切にありがとうございます。
半角ハイフン見当たりません。
25課まである解説書の、7課途中までで終わってしまう。
7課のその切れ目までを消してから新たに書き出したら
今度は31KBで、9課の途中まで。
9課のできた所の最後に半角スペースのみの行があったからそれも消したけど変化なかった。
むーん

53 :
ChainLPを使わずにいまだにeTilTranを使って傾き補正をしてるんですが
マルチコア非対応でいい加減処理の遅さがきつくなってきたので
別のソフト何かオススメあれば教えてもらえないでしょうか
こんなニッチなアプリってやっぱり世界中探してもeTilTranだけっすかねえ…
ChainLPがもっと小回りがきけばよかったんですけど
設計思想が違うみたいですしねえ

54 :
作者の気分が変わることを祈るのみ

55 :
>>53
俺もえちるとらん使ってるけど、傾き等をえちるとらんのGUI使って補正して
プロジェクト保存だけして、あとはそのプロジェクトのテキストデータを元に
imagemagick使ってバッチで画像処理してる。
一つの画像処理中に別の画像をと簡易マルチスレッドでね。

56 :
>>55
すみません、すこし詳しく教えていただけないでしょうか
えちるのプロジェクトデータの傾き補正情報ってこんなのの連続ですよね。
001.bmp,漫画,2916,4290,,0.00,0.00,-,-,100,X:0000 Y:0000 W:2916 H:4290,-,C:\hoge,12510718,-
これをどう変換してimagemagickに食わせてバッチ処理させればいいのでしょうか?

57 :
テス

58 :
>>56
ファイル,種別,幅,高さ,しおり,計測,補正,テクスト補正,ノンブル補正,拡大率,テクスト領域,ノンブル領域,パス,サイズ,レベル調整
というフォーマットで書かれてるから行をそのままforに入れれば各パラメータが取得できる
俺は小説ばかりなんで領域取得して余白カット・回転・リサイズ・挿絵と本文での処理変更等を一括してやってる。
これバッチの一部、パラメータ取得部。
for /f "delims=" %%x in (%project%) do (
set param=%%x
set param=!param:,,=,-,!
set param=!param:,,=,-,!
set param=!param:,,=,-,!
set param=!param:,,=,-,!
for /f "tokens=1,2,3,4,7,11,12,13,14 delims=," %%a in ("!param!") do @(
rem echo;ファイル=%%a ★ 種別=%%b ★ 幅=%%c ★ 高さ=%%d
rem echo;補正=%%e ★ テクスト領域=%%f ★ ノンブル領域=%%g ★ パス=%%h ★ サイズ=%%i
set pFilename=%%~a
set pCategory=%%~b
set pWidth=%%~c
set pHeight=%%~d
set pHosei=%%~e
set pText=%%~f
set pNumb=%%~g
set pPath=%%~h
set pSize=%%~i

59 :
>>58
ありがとうございます。
コピペでまんまでは動かないので自分なりにバッチコマンドを
調べているのですが、set param=!param:,,=,-,! の意味が良くわかりません
何のためにこの処理が4行も続いているのでしょうか?

60 :
それはパラメータが「-」じゃなくて無しになってる場合、つまり
 あいうえお,-,かきくけこ
ではなく
 あいうえお,,かきくけこ
みたいになってるとそこの項目が飛ばされて順番がずれてしまうので
「,,」を「,-,」に置換してる。
大体しおりのところがそうなってるんで1回でもいいんだけど、他にも出てきた時の為
念のために4回位置換してれば十分かなと。

61 :
というか今更気づいたけど2回で十分だったかな。

62 :
>>61
ありがとうございます。
さらに調べてみたところ私の環境では
× set param=!param:,,=,-,!
○ set param=%param:,,=,-,%
とすれば期待した動作をしました。
!はNT系のコマンドインタープリタ「cmd.exe」でサポートしている遅延環境変数を表現する時に採用されるとかなんとか、ググったらヒットしましたけれどよく分からないのでスルーします

63 :
遅延展開はリストを処理する場合に必要なんだが…
どうもバッチって何?というレベルに近い感じで
まあ先は長そうだ頑張ってくれ。

64 :
>>63
NT系といっても、Windows XPからは基本全てNT系のはずなので
なぜうちの環境(Win7 64bit)で動かないのかよく分からないですね
for /f "tokens=1,2,3,4,7,11,12,13,14 delims=," %%a in ("!param!") do @(
ここのdoの後の「@」もついてると動きませんでした。
削除すると期待通りの動作になりました。

65 :
そりゃ全体は200行位のバッチの途中だし頭も尻も無いんだし、パッとコピペして使えるわけがないよ…
ある程度知識があるもんだと思って書いたわけで、コマンドの意味が分からないレベルとは思ってなかったから。
OSは同じ7の64bitさ。

66 :
chainLPでページ番号をつけてくれないかな
自炊本のページ番号をそのまま入れるとページ番号と本文までの余白のため
かなり字が小さくなってしまう。
ページ番号をトリミングするとどこを読んでいるのかわからなくなってしまう。

67 :
>>66
ルーラー配置でノンブル入れればええやん・・・あほちゃう

68 :
chainLP、ルーラー配置のノンブルのフォントサイズってどっかで調整できる?
やたら大きなフォントで本文とかぶっちゃって使い物にならんのだが

69 :
>>66
もし、活字印刷の小説本のようなものでしたら、
まずは、ノンブル転送を試してみてはどうでしょうか。
(詳細設定->ページ補正タブ->小説解析)
(画像タブ内でページ補正を有効にするのも忘れずに)
参考までに、私が使っている設定値で関係するのを以下に。
ページ補正
 無効サイズ  13pix
 除去リミット 12から10%
 膨張サイズ  8pix (この値はノンブルの大きさの想定値でもあるらしい)
(この値でもノンブル転送の具合が悪い場合は、編集メニュー内の
事前トリミングを行って、ノンブルを仮想の紙の端により近づけてみる)
コレでうまくいくといいですが。どうでしょうか。ではでは。

70 :
RightFile以外で左綴じから右綴じに変換出来るソフトって無いですか?
パブーで購入したPDFなんですけど圧縮形式らしくRightFileでは弾かれて弄れないんです

71 :
age

72 :
ChainLP と かんたんPDFダイエットどっち使ってる?

73 :
ChainLP
簡単は使ったことない

74 :
かんたんの方が精度高いけど、自由度はゼロに近い

75 :
かんたん使ってる。前はChainLPだったけど、いちいち変換してやるのがめんどくなった。
その点かんたんはD&Dだけだからな。
こだわりがなければ自由度は変わらんと思うけど。

76 :
PDFを使わなくなったからChainLP
今はepubばっかだから

77 :
たまにノンブル削るのに失敗してるんだけど、
どうしようもない

78 :
ChainLPもノンブルが章の名前とか続いて長かったらトリミング失敗するね
でも事前トリミングで範囲広げて削れば問題ない、どうしようもないのは設計ミスじゃないかな?ダイエットくん

79 :
かんたんはあの奇怪なUIがどうにも受け付けない
物凄く押しつけの強い作者像が透けて見える

80 :
>>79
なんかおまえの方がおかしくないか。

81 :
何がどう悪いか、どのように改善すべきなのか
具体的な提案が出せないようでは、押し付けがましいのは
むしろクレームを出してるほうだよな。
とはいえ、私もかんたんPDFは使わなくなったんで大きなこと言えない。

前はChainLPだと読めないPDFがあったので使ってたんだが、
Acrobatで、読んだ後、保存しなおせばいいことに気がついたorz

82 :
ChainLPで自炊したPDFファイルをkobo gloの解像度[758*1024]、ページ補正小説優先、ガンマ補正1.6、シャープネス3で、CBZファイルにしたら、
元pdfファイルサイズが22.6Mなのに出来上がったcbzファイルサイズは80M。orz
こんなもんなのか?

83 :
>>82
画像設定16bitにしてるとか?

84 :
>>83
画像設定というのは、詳細設定の画像タブの色深度のところかな?そこは8bitになってる
ためしに元スケールで出力してみたら130Mになりやがったorz
Scansnapで取り込んだ文庫の小説であるが…
みんなファイルサイズは小さくなるんだよね…?

85 :
・元pdfが白黒二値  もしくは
・元pdfがグレスケ+OSがwin7
だったりする?

86 :
>>85
・元pdf白黒二値(+win8 64bit) です

87 :
・元画像 白黒ニ値(1ビット) : スキャンの段階で極限まで省サイズ化されてる
・ガンマ・シャープ補正 : 二値画にやっても効果なし、意味のない補正
・縮小 : 減色すると色数は増える。グレスケなら256色(8bit)化するのでそのままではサイズは肥大する
・色深度8bit CBZ出力 : 中身はjpg? png? どっちにしろ koboは16色(4bit)階調しかないので色深度 8bitは無駄
色深度1〜4bitにして画像形式をPNGかGIFにしてみ
E-Ink用に縮小しない場合でも二値画のjpg化は害しかないので割けること

88 :
×縮小 : 減色すると色数は増える。
○縮小 : 縮小すると色数は増える。
いかんわ、減色で色数増えたら困るね

89 :
減色のつもりが増色になってるというオチかw
しかも補正によってノイズが乗り圧縮が効きにくくなってる、と

90 :
なんでグレースケールのpngは良くてjpgは駄目なんだ?

91 :
256階調グレスケではなく16階調にしたいから
jpgは色数を制限できないフォーマットなため、256階調グレスケかフルカラーのどちらかしか作れない
二値画像はjpg変換した段階で2色ではなくなり余計なノイズが入る

あとそれとは別にwin7には256階調グレスケが16階調に強制減色表示になるGDI+バグがあり
ChainLPは読み込み時に影響を受ける
http://awabi.2ch.sc/test/read.cgi/download/1343758619/406,414-415
win7上で起動したChainLPはグレスケjpg(pdf)を16色画像として読み込んでしまうのであまりよろしくない
グレスケjpg→(16階調化!)→ガンマなど補正→デバイスに合わせた縮小→デバイスに合わせた減色
ScanSnapだとスキャン段階で白飛ばし入ってるから見た目的には気にならない程度の変化かもしれない
ただ、サイズ肥大の原因になってる可能性はある

92 :
>>90
圧縮率が標準ぐらいでもぼやけると思う、字がにじむっていうのかな
pngは色数を減らすが、にじまずに白黒はっきりする、だから白黒原稿には合うんじゃないかな?
挿絵はjpg、本文はpng、俺はこうしてる

93 :
白黒はっきりなのは2値でしょう
でも16階調とかのパネル用に2値は不利だからアンチエイリアスをかけるのが普通で、
画像は最初からにじんでいる
それがjpgかpngかで差が出るとしたら、圧縮のしすぎによるアーティファクトが
見えてしまう場合で、それは圧縮の設定に問題がある

94 :
アーティファクトでググったけど意味が分からん
jpgは不可逆でpngは可逆。 この段階で歴然とした差がある
jpgで保存したら2値だろうが16階調だろうがフルカラーかグレスケ256階調に増色されるし
16階調しかないE-Ink端末でそれを表示したら端末側で再度減色しなくちゃならなくて遅くなる
jpgの圧縮って、ようはどこまで劣化させるかってことだし、
見た目に影響しないレベルまでクオリティ上げようと思ったら16階調pngよりサイズが大きくなる
jpgはあくまで写真みたいに階調の多いもの向けのフォーマット、クッキリハッキリの画像は苦手なんだよ

95 :
日本では一般的にブロックノイズと言われる代物>アーティファクト(artifact)

96 :
モスキートノイズも忘れないで

97 :
chainlpで見開きをかってに連結するのどうやったらやめれるの

98 :
紙がなくて真っ黒になった部分を白にする方法てあります?

99 :
塗る

100 :
>>98
トイレでのトイレットペーパーの話?


100〜のスレッドの続きを読む
10年後紙媒体がどうなっているかを予想しよう
【自薦他薦】Kindleおすすめ本スレ【ステマ自由】
【携帯】漫画家@デジタルメディア33【web】
[Kindle] 歴史関連の書籍について語るスレ Part.1
BOOKLIVE PART24
Kindle セール情報 part129
Kindle セール情報 part12
電子書籍ストア セール情報 総合スレ part25
Kindle セール情報 part88
kindle セール情報 part132
--------------------
山形の女子アナ専用スレ★Part40
【韓国メディア】 新型コロナで「日本は韓国の支援を内心期待?」 韓国ネット「過去の歴史への反省がないまま支援するのは絶対に反対だ」 [影のたけし軍団ρ★]
test    test
【集団自殺か】江戸川区の5人遺体、1人は行方不明の20代女性と見られる 住人男性が知人に「自殺したい人が集まった」と連絡
【バツイチ】離婚経験者の婚活part1【不倫借金DVD】
ぬるぽで1時間以内にガッされなければ神@機種板250
2019年1月期ドラマ予想スレッド 3
【総合】【DQ11】ドラゴンクエストXI 過ぎ去りし時を求めて Part408
菅野美穂 part36
お前は騙されてゴキ板にわけだが3度目の正直
地元の主婦層に愛されていたスーパーが突然「ドンキ」に…住民に不安広がる [193231117]
jig vs. SCOPE
【速報】安倍首相「本来、日産内で片付けて貰いたかった」
【日韓】日本、WTOに韓国を提訴 ステンレス棒鋼関税で[09/13]
★【ゲーム】美少女ゲームメーカー「ミンク」が2018年で「終演」 25年の歴史に幕 「夜勤病棟」シリーズなどをリリース
*保守党*歴代画素数閣僚スレッド大会‐自由党‐
【Cold Steel】コールドスチール Part28【冷鋼】
麻生「汗もかいていない儲けを優遇するのは国民感情的にどうか」
【くまモン】 熊本県庁 part10
☆歌舞伎の子役スレ☆ Part.2
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼