tag:crieit.net,2005:https://crieit.net/tags/scanlation/feed 「scanlation」の記事 - Crieit Crieitでタグ「scanlation」に投稿された最近の記事 2022-01-11T21:08:15+09:00 https://crieit.net/tags/scanlation/feed tag:crieit.net,2005:PublicArticle/17925 2022-01-08T16:27:09+09:00 2022-01-11T21:08:15+09:00 https://crieit.net/posts/bbb085470b763b7e8bcb423f4b235d64 スキャンレーション <h1 id="scanlation について"><a href="#scanlation+%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6">scanlation について</a></h1> <p>スキャンレーション( scanlation )で検索すると、その言葉の定義から、ガイドラインやチュートリアル、または役割名称や、その広報的なサイトの情報がたくさんある。</p> <p>今は活動していないスキャンレーションのグループ名と、そのプロファイルのページのデータベース (sqlite file)。</p> <p><a target="_blank" rel="nofollow noopener" href="https://www.mediafire.com/file/qlse91vdwyletgx/scanlation-g.db/file">https://www.mediafire.com/file/qlse91vdwyletgx/scanlation-g.db/file</a><br /> <img src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/225786/85947479-df01-7dac-fbb4-f6d8dc21aed8.jpeg" alt="IMG_20211113_140504_811.jpg" /></p> <p><a target="_blank" rel="nofollow noopener" href="https://www-mangaupdates-com.translate.goog/aboutus.html?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=nui">https://www-mangaupdates-com.translate.goog/aboutus.html?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=nui</a></p> <p>過去に翻訳されたタイトルのオリジナルの和名とそれ以外の対照を作りたい場合は有効かもしれないし、そうでもないかもしれない。</p> <p>著作権がらみで問題のあるコンテンツのダウンロード情報や、データ自体は含まないと宣言されているサイトから全てのスキャンレーショングループのプロファイルページの所在を抽出してから、各プロファイルページにアップデートしてアーカイブされている翻訳済みの漫画の英語タイトルを抽出すれば、プロファイルされたスキャンレーションングループについては、全ての翻訳漫画タイトルを知れるということになる。<br /> 抽出の方法はグループのプロファイルページの所在、 プロファイルページ内にある翻訳したシリーズ名、日時という順にたどると効率が良さそう。</p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/zbtnk/png">1: タイトルを考えるのが面倒な scanlation groups counter プログラム Python link</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/nekon/png">2: a , b<br /> 2つのデータベースをマージする Lua プログラムサンプル link</a> :[ 依存関係 lsqlite3 https://github.com/LuaDist/lsqlite3/blob/master/examples/smart.lua]</p> <p>1.1.1.1<br /> <a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/1.1.1.1">https://en.m.wikipedia.org/wiki/1.1.1.1</a></p> <p>スキャンレーションは海賊サイトのエコシステムの一環で、フェーズとしてはオンラインでの海賊配信の水際に位置していると考えられる。<br /> 2次創作漫画画像を作るために、漫画をスキャナーでスキャンする必要があるわけだが、漫画を入手してスキャンし、アップロード ① してダウンロードアドレスを告知する ② ということをしているというところが、ボトムで、スキャンレーションの作業のエントリーポイントにもこの行程が不可欠。<br /> スキャンしてアップロード ① する人は必ずしもスキャンレーションチームにしかいないわけではないが、アップロードされたスキャン済み画像をダウングレード ③ して海賊配信 ④ していたり、スキャン画像をクリーンアップして翻訳、タイプセットして、翻訳版の海賊配信サイトにアップロード ⑤ していたりと、それぞれに直接関係があったり無かったりするのだろうけども、スキャンレーションという枠では、ひとまとまとまり情報として関係性が見える。例えば、このグループがここ ④ へアップロード ⑤ した等。</p> <p>④ のサイト群については、正当な方法(カドカワ的に「インターネット上の海賊版対策に関する検討会議 第9回会合 平成30年10月15日 議事録[^0]」)similarweb<sup id="fnref:12"><a href="#fn:12" class="footnote-ref" role="doc-noteref">1</a></sup><sup id="fnref:8"><a href="#fn:8" class="footnote-ref" role="doc-noteref">2</a></sup> <sup id="fnref:9"><a href="#fn:9" class="footnote-ref" role="doc-noteref">3</a></sup>で横並びに見えるもののことを主に指すようだが、ボトムアップから見るとすると、行為とモチベーション度に着目する<sup id="fnref:10"><a href="#fn:10" class="footnote-ref" role="doc-noteref">4</a></sup>とスキャンレーションのサイドからたどると動線も把握できる。スキャンレーションのさらに二次コピーなどが ④ に回収されて公開されている場合もあるだろう。トラフィックの大きさは、配信自体の技術に左右されるので、着目される経済的損失について語られるのはトラフィックの大きな上流の方のことだと思われる。漫画 BANK は ④ に含まれる(すでにアップロードされて海賊配信されているサイトからの画像流用)。</p> <p>これは想像なのでイマジネーションは図にした方がいい。</p> <p><img src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/225786/ed3db1b5-2e40-1584-b6a3-4ba59ce3704f.png" alt="oie_1I69MA5YrCfZ.png" /></p> <p><a href="https://crieit.now.sh/upload_images/a4659321b5cc94fb81afc1c7163b2a6761dd7319f33e1.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/a4659321b5cc94fb81afc1c7163b2a6761dd7319f33e1.png?mw=700" alt="image" /></a></p> <p><a target="_blank" rel="nofollow noopener" href="https://fanlore.org/wiki/Scanlation_Process#General_Process">https://fanlore.org/wiki/Scanlation_Process#General_Process</a></p> <p>参考: https://kknews.cc/comic/moz43xz.html</p> <p><a target="_blank" rel="nofollow noopener" href="https://kknews-cc.translate.goog/comic/moz43xz.html?_x_tr_sl=zh-CN&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=nui">https://kknews-cc.translate.goog/comic/moz43xz.html?_x_tr_sl=zh-CN&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=nui</a></p> <p><a target="_blank" rel="nofollow noopener" href="http://onepiece.ria10.com/Entry/3752/">http://onepiece.ria10.com/Entry/3752/</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://www.similarweb.com/ja/website/mangapanda.onl/">https://www.similarweb.com/ja/website/mangapanda.onl/</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://www2.accsjp.or.jp/thanks/thanks39.php">https://www2.accsjp.or.jp/thanks/thanks39.php</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://www.neliti.com/publications/326921/accuracy-of-english-indonesian-scanlation-of-detective-conan-manga-as-compared-t">https://www.neliti.com/publications/326921/accuracy-of-english-indonesian-scanlation-of-detective-conan-manga-as-compared-t</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/scanlation-titles/png">3: link</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/zbtnk/png">1:link</a> / <a target="_blank" rel="nofollow noopener" href="https://rentry.co/nekon/png">2:link</a> / <a target="_blank" rel="nofollow noopener" href="https://rentry.co/scanlation-titles/png">3:link</a> とプログラムにせっせと、動いてもらって 3 をポチッとしてから翌日起きて、途中で止まってると思ってたら、朝になっても昼前まで止まらない量のデータをせっせと書き込んでいた。<br /> カウンターは 106000 を越えていて、なんか無理しているなぁと思いつつ、そのわきで次のプログラムを書きはじめて、</p> <p><img src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/225786/2393c94a-9848-b7d1-d308-367fa26659d2.png" alt="oie_png (1).png" /></p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/oytah/png">4:link</a> を書いた。</p> <p>たぶんこれも明日もお昼までうごいているんではないか。</p> <p><a target="_blank" rel="nofollow noopener" href="https://www.oreilly.co.jp/books/9784873113487/">https://www.oreilly.co.jp/books/9784873113487/</a></p> <p>漠然とした中での目的としては、翻訳された(おそらく勝手に)漫画のタイトルからオリジナルのタイトルを知りたいのと、その他の言葉でのタイトルを眺めたいので、そうするとどうやって組み上げたらいいのかなということをやってみたい。</p> <p>ということで、まずスキャンレーショングループが過去から現在まで翻訳したシリーズになった(単行本とかのことだと思われる)ものをカウントアップするために、まずグループのリストを作る。これが <a target="_blank" rel="nofollow noopener" href="https://rentry.co/zbtnk/png">1:link</a> のコード。<br /> <a target="_blank" rel="nofollow noopener" href="https://rentry.co/zbtnk/png">1:link</a> でできたリストのなかには、グループについてのプロファイリングされた個別のページのアドレスがあり、このプロファイリングされたページ上にグループの翻訳したシリーズがリストアップされている。<br /> <a target="_blank" rel="nofollow noopener" href="https://rentry.co/zbtnk/png">1:link</a> で作れるデータベースを複数足し合わせるのが <a target="_blank" rel="nofollow noopener" href="https://rentry.co/nekon/png">2:link</a> のコード。なぜ、Lua なのか、コンパクトで速いから。同じように他の言語で書いて同じような速度かもしれないが、コードを見れば、見える通りのことなのでシンプル。遅くはない。</p> <p>hy (clojure lisp 風 Python) 言語に合わせて <a target="_blank" rel="nofollow noopener" href="https://rentry.co/nekon/png">2:link</a> と同じものを Lua の Lisp 風言語 <a target="_blank" rel="nofollow noopener" href="https://github.com/bakpakin/Fennel/blob/main/reference.md">fennel</a> に直してみると</p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/fennel/png">2:link fennel</a></p> <p><a target="_blank" rel="nofollow noopener" href="https://qiita.com/dauuricus/items/37b80ddab68777414753">Vim</a> だとプラグインを設定しないとちょっと難しい感じだけど、<a target="_blank" rel="nofollow noopener" href="https://kakoune.org/">kakoune</a> だとデフォルトで色分けはしてくれる。どうなってるんでしょう。<a target="_blank" rel="nofollow noopener" href="https://qiita.com/dauuricus/items/c0023fb476c5f708292e">vis editor</a> も。</p> <p>プロファイルされたページのシリーズタイトルを足し合わせて記録していくのが 3:link のコード。Python だが hy 言語。今のところ hy で書くメリットは分かりやすさ。<br /> SQLite のバインドも Python 独自のものなので、select して execute されて戻ってくるデータが空のときどうやって空のデータを比較できるのかというところが言語とバインドによって違うので、そこは注意しなくてはいけない。Lua の場合は、空の場合は素通りで、値を判定する式自体を無視するよう、そのことを分かっていたらシンプル。</p> <p>例えば、</p> <pre><code class="lua">local smt1 = "SELECT id FROM tbl_scanlation ORDER BY id DESC LIMIT 1 ;" local last1 = 0 for id in db1:urows(smt1) do last1 = id end </code></pre> <p>これは Lua バインドで sqlite3 データベースの tbl_scanlation というテーブルのデータの中の primary キー連番 id 番号の最後の int 値を取り出す式を実行して last1 に代入したい箇所だが、テーブルの中にデータが入ってなければ <code>local last1 = 0</code> で初期化している値が入る。 nil とか -1 とかにはならない。python や Ruby 、 go や nim など、またそれぞれ違うので、いろんな別の言語にて書き換える場合は、<strong>無い場合</strong>どういう値が入るのかよく調べなければいけない。SQLite3 自体では返ってくる値は決められているが、その値に対する値は、バインドによって書き換えられて処理されているようなので。</p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/scanlation-titles/png">3:link</a> で出来上がるデータベースの件数は三万件くらいだろうかと思っていたが、10 万件以上だった。SQLite の場合は扱える数はそれ以下のはずだが、無理でもできるとこまででいいのでがんばってもらう。</p> <p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/oytah/png">4:link</a> の様子。お昼になっても終わっていない。<br /> <img src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/225786/736d3cbd-136e-d509-7247-54a18c2061ff.png" alt="Screenshot_20211120-113635.png" /></p> <p>一週間くらい経ってる気がするが、VALID データが 96,426 。つまり、中国、韓国、日本の漫画がスキャンレーショングループによって、それだけの数は翻訳されている。<br /> sqlite3 database file<br /> <a target="_blank" rel="nofollow noopener" href="https://we.tl/t-xUEh2MPRcF">https://we.tl/t-xUEh2MPRcF</a></p> <p><img src="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/225786/27ec591c-9a79-c606-7259-195d0f4161f3.png" alt="Screenshot_20211211-143003_kindlephoto-66542057.png" /></p> <div class="footnotes" role="doc-endnotes"> <hr /> <ol> <li id="fn:12" role="doc-endnote"> <p>資料7 https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2018/kaizoku/dai9/gijisidai.html <a href="#fnref:12" class="footnote-backref" role="doc-backlink">↩︎</a></p> </li> <li id="fn:8" role="doc-endnote"> <p>https://en.globes.co.il/en/article-similarwebs-controversial-route-to-wall-street-1001376912 <a href="#fnref:8" class="footnote-backref" role="doc-backlink">↩︎</a></p> </li> <li id="fn:9" role="doc-endnote"> <p>These Chrome extensions spy on 8 million users 31 Mar 2016 https://mweissbacher.com/2016/03/31/these-chrome-extensions-spy-on-8-million-users/ <a href="#fnref:9" class="footnote-backref" role="doc-backlink">↩︎</a></p> </li> <li id="fn:10" role="doc-endnote"> <p>https://www.reddit.com/r/scanlation/about/ <a href="#fnref:10" class="footnote-backref" role="doc-backlink">↩︎</a></p> </li> </ol> </div> tomato