tag:crieit.net,2005:https://crieit.net/tags/%E3%82%A4%E3%83%B3%E3%83%95%E3%83%AB%E3%82%A8%E3%83%B3%E3%82%B5%E3%83%BC/feed
「インフルエンサー」の記事 - Crieit
Crieitでタグ「インフルエンサー」に投稿された最近の記事
2022-11-19T11:55:11+09:00
https://crieit.net/tags/%E3%82%A4%E3%83%B3%E3%83%95%E3%83%AB%E3%82%A8%E3%83%B3%E3%82%B5%E3%83%BC/feed
tag:crieit.net,2005:PublicArticle/18306
2022-10-16T22:26:29+09:00
2022-11-19T11:55:11+09:00
https://crieit.net/posts/c2b7c645c32fda0b2cffd3aea91d6a01
グレートクソアルゴリズム
<h1 id="アルゴリズムはチートされる 注目と広告、アテンション エコノミー / attention economy"><a href="#%E3%82%A2%E3%83%AB%E3%82%B4%E3%83%AA%E3%82%BA%E3%83%A0%E3%81%AF%E3%83%81%E3%83%BC%E3%83%88%E3%81%95%E3%82%8C%E3%82%8B%E3%80%80%E6%B3%A8%E7%9B%AE%E3%81%A8%E5%BA%83%E5%91%8A%E3%80%81%E3%82%A2%E3%83%86%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%B3+%E3%82%A8%E3%82%B3%E3%83%8E%E3%83%9F%E3%83%BC+%2F+attention+economy">アルゴリズムはチートされる 注目と広告、アテンション エコノミー / attention economy</a></h1>
<p>それっぽいタイトルでありながら儲け話の記事じゃないよ。<br />
Youtube content ID と Mult-iChannel Networks についての内容です。<br />
<a href="https://crieit.now.sh/upload_images/9b203b0e01c417af299ec2f82f93eb656357508aa013f.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/9b203b0e01c417af299ec2f82f93eb656357508aa013f.png?mw=700" alt="image" /></a><br />
<a target="_blank" rel="nofollow noopener" href="https://we.tl/t-1BtTeio0RG">https://we.tl/t-1BtTeio0RG</a></p>
<p><code>vi_id</code> ... youtube <a target="_blank" rel="nofollow noopener" href="https://rentry.co/fpdf3">videoId</a><br />
<code>ch_id</code> ... youtuber <a target="_blank" rel="nofollow noopener" href="https://we.tl/t-Ga2IvD4mKi">channel id</a><br />
<code>pu_da</code> ... publishedDate</p>
<p>"https://m.youtube.com/watch?v=/" + <a target="_blank" rel="nofollow noopener" href="https://rentry.co/fpdf3">videoId</a><br />
"https://m.youtube.com/channel/" + <a target="_blank" rel="nofollow noopener" href="https://we.tl/t-Ga2IvD4mKi">channelId</a></p>
<pre><code> 1 vi_id:zvrsGCyPvF0 ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-10-09
2 vi_id:Uq0TSMmc1Z8 ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-10-07
3 vi_id:WsHHOrQ18Yk ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-09-23
4 vi_id:sqbj63hrlHI ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-09-17
5 vi_id:EFYZCv0aEIU ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-09-08
6 vi_id:iGVULqpmiEE ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-08-26
7 vi_id:FQU_ObSjDmc ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-08-16
8 vi_id:GAkZEQglk3k ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-08-06
9 vi_id:IW3et-CxvC4 ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-08-04
10 vi_id:D9OeuTyzMLE ch_id:UC0yQ2h4gQXmVUFWZSqlMVOA pu_da:2022-07-29
</code></pre>
<p>ファイルはテキストファイルで、<code>;</code> で区切って三項目並べています。</p>
<p><a href="https://crieit.now.sh/upload_images/c7678b959f9a21d729495933ca2e6eb3635bda0f5ed31.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/c7678b959f9a21d729495933ca2e6eb3635bda0f5ed31.png?mw=700" alt="関連するyoutube チャンネル数の比較" /></a></p>
<p><a target="_blank" rel="nofollow noopener" href="https://we.tl/t-dHlu1z0fR9">https://we.tl/t-dHlu1z0fR9</a></p>
<p>2022 時点で関係する youtube channel リスト 18,786 の youtube videoid から調べ</p>
<p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/p427u">https://rentry.co/p427u</a></p>
<hr />
<p><a href="https://crieit.now.sh/upload_images/68fd363b94aeace56076a422a5a49d6d634cd5d74aac2.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/68fd363b94aeace56076a422a5a49d6d634cd5d74aac2.png?mw=700" alt="image" /></a></p>
<h2 id="狂ったアルゴリズムはチートされる"><a href="#%E7%8B%82%E3%81%A3%E3%81%9F%E3%82%A2%E3%83%AB%E3%82%B4%E3%83%AA%E3%82%BA%E3%83%A0%E3%81%AF%E3%83%81%E3%83%BC%E3%83%88%E3%81%95%E3%82%8C%E3%82%8B">狂ったアルゴリズムはチートされる</a></h2>
<p><a target="_blank" rel="nofollow noopener" href="https://crieit-net.translate.goog/posts/c2b7c645c32fda0b2cffd3aea91d6a01?_x_tr_sl=auto&_x_tr_tl=en&_x_tr_hl=en&_x_tr_pto=wapp">transrate to</a></p>
<p><a target="_blank" rel="nofollow noopener" href="https://youtu.be/sr1KscMfBOY">recommendation system</a> というのか、普通に <strong>カスタムされていない chrome ブラウザ</strong> などで、例えば日経テレ東の youtube channel にある、<a target="_blank" rel="nofollow noopener" href="https://www-wired-com.translate.goog/story/who-owns-4chan/?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=wapp">西村博之</a>と<a target="_blank" rel="nofollow noopener" href="https://twitter.com/uekky/status/1575768726812909569?s=20&t=oMNAPMiMa2vZc8_S6ZYL1Q">成田某</a>の番組の映像のサムネイルをクリックすると、そのあとからは、ブラウザのなかに表示されるものは、<a target="_blank" rel="nofollow noopener" href="https://archive.ph/Iez0A">日経テレ東 channel</a> のサムネイルがついたクリップがウィンドウの 50 % くらいを独占するようになる。</p>
<p><a target="_blank" rel="nofollow noopener" href="https://0bin.net/paste/ZnM8373E#91HmGyP3HDSCC2nvf0riIhEzGwZ6uv72BW1+3c1JNRc">関連 youtube URL リスト 2007 本</a></p>
<p>cf. 以下の条件では結果が変わるかもしれません。<br />
<a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/Brave_%28web_browser%29">https://en.m.wikipedia.org/wiki/Brave_%28web_browser%29</a><br />
<a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/DuckDuckGo">https://en.m.wikipedia.org/wiki/DuckDuckGo</a><br />
<a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/NewPipe">https://en.m.wikipedia.org/wiki/NewPipe</a><br />
Vanced is discontinued but ReVanced is here - HOW to install<br />
<a target="_blank" rel="nofollow noopener" href="https://youtu.be/mU4M2m_cL7g">https://youtu.be/mU4M2m_cL7g</a><br />
<a target="_blank" rel="nofollow noopener" href="https://github.com/pi-hole/pi-hole">https://github.com/pi-hole/pi-hole</a></p>
<p>これを、Youtube からの自動の推薦、つまり、<a target="_blank" rel="nofollow noopener" href="https://blog.youtube/inside-youtube/on-youtubes-recommendation-system/">youtube recommendation system</a> と呼ぶことにして、その推薦するクリップの判定アルゴリズムが狂ってるなと思っている(個人の感想ですよ)というか<a target="_blank" rel="nofollow noopener" href="https://rentry.co/zuprc">クソ</a>。踏んだら(クリックしたら)、ずっと(関連動画を薦める個人属性が)くっついてしまうので、その後の検索でも検索したい内容と無関係に分析された属性によって薦めてくる見たくない動画内容が半分まぎれて、集中が拡散される作りになっている。</p>
<p>rf.<br />
Collaborative_filtering<br />
<a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/Collaborative_filtering">https://en.m.wikipedia.org/wiki/Collaborative_filtering</a></p>
<h3 id="youtube recommendation system"><a href="#youtube+recommendation+system">youtube recommendation system</a></h3>
<p><strong>機械学習に使うポイントの付け方とか、合理的に機械的に評価しているようでいて、単純にすべてがバグってる</strong> としか思えない(個人の感想ですよ)。<br />
関連の動画を排除しようとすると表示されている動画のサムネイルに対して一つづつ「興味がないために非表示にする」を選んで閉じていかないといけないというわけ。</p>
<blockquote>
<p>Hated that video? YouTube’s algorithm might push you another just like it.<br />
New research from Mozilla shows that user controls have little effect on which videos YouTube’s influential AI recommends.<br />
By Hana Kirosarchive page<br />
September 20, 2022<br />
<a target="_blank" rel="nofollow noopener" href="https://www.technologyreview.com/2022/09/20/1059709/youtube-algorithm-recommendations/">https://www.technologyreview.com/2022/09/20/1059709/youtube-algorithm-recommendations/</a></p>
</blockquote>
<hr />
<blockquote>
<p>Does this button work?<br />
Investigating YouTube’s ineffective user controls<br />
<a target="_blank" rel="nofollow noopener" href="https://foundation.mozilla.org/en/youtube/user-controls/">https://foundation.mozilla.org/en/youtube/user-controls/</a></p>
</blockquote>
<hr />
<p>単純に、ユーザーのためのアルゴリズムではなくてプラットフォームの方向性にそくしたアルゴリズムだからといえばそれまでだ。要するに、知りたい見つけたいものを探す動機のあるユーザーに対して、その道中にお菓子を置いてみたり、エロ本を置いてみたりして集中を乱してザッピングさせるようなアルゴリズムだ。そんなの要らないというものがずっと消えないで残ると、モチベーションが拡散されていく。</p>
<p>このバグのように悪夢的な的外れの youtube recommendation system について、<a target="_blank" rel="nofollow noopener" href="https://desuarchive.org/qa/chunk/706294/">アメリカのインターネットの匿名掲示板</a>のオーナーである人物は、このバグみたいな関連動画をオススメするアルゴリズムは、このアルゴリズムの特性を利用してチート可能と確信して、Youtube によって設定されたアルゴリズムを活用して、広告収入をより多く得れるように場を設定するように<a target="_blank" rel="nofollow noopener" href="https://getnews.jp/mcn/kirinuki">実践</a>したのだろう。<br />
<a target="_blank" rel="nofollow noopener" href="https://search.brave.com/search?q=切り抜き動画&source=android">あんまり遠回しに表現しすぎると意味わからない ?</a></p>
<p>rf.<br />
Bibliotheca Anonoma<br />
<a target="_blank" rel="nofollow noopener" href="https://imgur.com/a/9ggNCFl">https://wiki.bibanon.org/4chan/History</a><br />
アノニマス BBS プログラムの系譜をまとめていく<br />
<a href="https://crieit.net/posts/BBS">https://crieit.net/posts/BBS</a></p>
<h3 id="広告収入をより多く得れるように場を設定"><a href="#%E5%BA%83%E5%91%8A%E5%8F%8E%E5%85%A5%E3%82%92%E3%82%88%E3%82%8A%E5%A4%9A%E3%81%8F%E5%BE%97%E3%82%8C%E3%82%8B%E3%82%88%E3%81%86%E3%81%AB%E5%A0%B4%E3%82%92%E8%A8%AD%E5%AE%9A">広告収入をより多く得れるように場を設定</a></h3>
<h4 id="チーティング ?"><a href="#%E3%83%81%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0+%EF%BC%9F">チーティング ?</a></h4>
<blockquote>
<p>"<strong>ユーザーの Youtube 視聴画面全部を自分の関連動画のサムネイルで埋め尽くし、オススメに自分の関連するものばかりを設定する</strong> という目的を達成するには、自分以外に自分が配信した <a target="_blank" rel="nofollow noopener" href="https://gigazine.net/news/20220624-yt-dlp-download-sections/">youtube 映像からコピーコンテンツを作れる</a>ひとが、<strong>どんどんコピー動画を作りコンテンツの量を増し</strong> て、それを youtube へアップしていけば、より楽に自分の関連コンテンツが溢れかえる。<br />
あとは、狂った youtube recommendation system が、ユーザーが一度でもそれら関連動画へのリンクをクリックすれば、ずっとそれら関連動画をユーザーに薦め続ける。<br />
まるで malware に感染したみたいに、ソフトに逃げられない動線を張り巡らされてしまうのだ。<br />
自分では編集せず、うまく見やすく編集したものか、偶然でも何でもいいけど、再生回数が上がったものから、売り上げを上納してもらえる仕組みをつくればいい"</p>
</blockquote>
<p>と考えてみる(個人の意見です)。</p>
<h3 id="Multi Channel Networks ( MCNs )"><a href="#Multi+Channel+Networks+%28+MCNs+%29">Multi Channel Networks ( MCNs )</a></h3>
<p>そして、そのためには、コピーコンテンツを <strong>テイクダウン</strong>(ノーティスアンドテイクダウン)するライセンスを持てばいい。<br />
そうすると、コピー動画の配信から視聴された回数分の広告収入を自分に流入させれる、ということで、そういった権限のライセンス( <a target="_blank" rel="nofollow noopener" href="https://support.google.com/youtube/answer/2797370?hl=ja">youtube content ID</a>を管理できる )を特権として持った企業として、いくつかの会社がある。</p>
<p>rf.<br />
* Hololive Production (Japan)<br />
* Nijisanji (Japan)<br />
* <a target="_blank" rel="nofollow noopener" href="https://www.uuum.co.jp/2022/11/10/88263">uuum (Japan)</a><br />
<a target="_blank" rel="nofollow noopener" href="https://en.m.wikipedia.org/wiki/List_of_multi-channel_networks">https://en.m.wikipedia.org/wiki/List_of_multi-channel_networks</a></p>
<p>この業態を <a target="_blank" rel="nofollow noopener" href="https://scholar.google.co.jp/scholar?q=Multi+Channel+Networks&hl=en&as_sdt=0&as_vis=1&oi=scholart">Multi Channel Networks</a> という。<br />
MCNs の周辺の動態を調べている研究によると、MCNs と手を組まなくてはならない理由として、脱税と身元隠しが主要な理由としてあるらしい。</p>
<p>rf.<br />
<a target="_blank" rel="nofollow noopener" href="https://www.google.com/search?q=Behind+the+Tube:+Exploitative+Monetization+of+Content+on+YouTube&sourceid=chrome-mobile&ie=UTF-8">Behind the Tube: Exploitative Monetization of Content on YouTube</a><br />
Andrew Chu, Arjun Arunasalam, Muslum Ozgur Ozmen and Z. Berkay Celik<br />
日本語解説記事<br />
<a target="_blank" rel="nofollow noopener" href="https://www.itmedia.co.jp/news/articles/2208/17/news061_3.html">https://www.itmedia.co.jp/news/articles/2208/17/news061_3.html</a></p>
<blockquote>
<p><a href="https://crieit.now.sh/upload_images/84fa6c621192b78e5aceccb25def6621634cd2be15bf9.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/84fa6c621192b78e5aceccb25def6621634cd2be15bf9.png?mw=700" alt="image" /></a><br />
<a href="https://crieit.now.sh/upload_images/de8f3deb6167aaec0dfdd648062e2c3e634cd6d0ef5cf.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/de8f3deb6167aaec0dfdd648062e2c3e634cd6d0ef5cf.png?mw=700" alt="image" /></a><br />
YouTube Multi-Channel Networks - Broughy Explains ( 2016 Aug 9 )<br />
<a target="_blank" rel="nofollow noopener" href="https://youtu.be/MpYqxDxlKUw?t=141">https://youtu.be/MpYqxDxlKUw?t=141</a></p>
</blockquote>
<p>要するに google との契約で Youtuber とダイレクトにすんでしまう関係を、わざわざ MCNs と契約して google からの広告収入をダイレクト受け取らない理由は、そのモチベーションと重なるということになる。簡単に言うと、どーしても google と直接契約したくはないか、できない理由がある場合は、そうするよね。もちろん、儲かるしかけを設定できるならば、だが。</p>
<p>これを踏まえて、コピー動画をつくって再生回数をあげれるというクラスターが MCNs にぶら下がって収益を得る、その仕組みが具現化したのが、切り抜き動画群なわけだ。</p>
<p>それを支えるのがクラスターを作り出す中間の右から左へコンテンツを納品していく業者で、おそらく労働市場(副業というラベルになっている)で、マッチングした実作業労働者がいるのだろう。たぶん。<br />
例えば、クラウドワークスにアカウントつくって覗いてみると、なーんだこれーという動画編集丸投げ案件が(よく)ある。</p>
<h3 id="アテンションを加熱させるためのヘイトへのエスカレーション"><a href="#%E3%82%A2%E3%83%86%E3%83%B3%E3%82%B7%E3%83%A7%E3%83%B3%E3%82%92%E5%8A%A0%E7%86%B1%E3%81%95%E3%81%9B%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AE%E3%83%98%E3%82%A4%E3%83%88%E3%81%B8%E3%81%AE%E3%82%A8%E3%82%B9%E3%82%AB%E3%83%AC%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3">アテンションを加熱させるためのヘイトへのエスカレーション</a></h3>
<p>こういったエコシステムの弊害で、より多くのアテンションを稼ぎだすためだけにエクストリームな表現、アジテーシーションがエスカレーションして、よりリアクションに熱気がでる<a target="_blank" rel="nofollow noopener" href="https://archive.ph/ecNdR">ヘイト</a>よりな言動が産み出されていく。</p>
<p>Youtube では人間を使ったクレーム対応に日本語を理解する人間が関わっているのいるのかどうかはかなり疑問がある。{ 遠回しな表現 }</p>
<p>Youtube プラットフォーム上での<strong>コンテンツの内容について倫理規定はどこまでもグレーゾーン</strong>であるわけで、コンテンツによって収益を得ようとする youtuber は youtube が裁定する倫理違反かどうかのジャッジの境界を探りつつも、より強い<a target="_blank" rel="nofollow noopener" href="https://archive.ph/dgjSV">ヘイト</a>を内包するゴシップに増長していく傾向がある。</p>
<p><a target="_blank" rel="nofollow noopener" href="https://archive.ph/ecNdR">ひろゆき氏「沖縄の人って文法通りしゃべれない」 県民の“日本語”めぐり発言<br />
2022年10月12日 05:47</a></p>
<p>有限会社未来検索ブラジル 元社長の考察 2022/9/7<br />
<a target="_blank" rel="nofollow noopener" href="https://otakei.otakuma.net/archives/2022090706.html">https://otakei.otakuma.net/archives/2022090706.html</a></p>
<p>4 つの Responsibility( 責任): Remove、 違反コンテンツの削除<br />
2019年9月12日木曜日<br />
<a target="_blank" rel="nofollow noopener" href="https://youtube-jp.googleblog.com/2019/09/4-responsibility-remove.html">https://youtube-jp.googleblog.com/2019/09/4-responsibility-remove.html</a><br />
<a target="_blank" rel="nofollow noopener" href="https://support.google.com/youtube/answer/2801939?hl=ja&ref_topic=9282436">ヘイトスピーチに関するポリシー</a></p>
<p>切り●き動画を推奨して、たくさんの亜種を増殖させたいインフルエンサーは、やや微妙な表現で匂わせるコントラバーシャルな言動を使うが、そこから派生していく亜種は、そういった表現の部分を拾い上げて全面に押し出して、●●す等のように●●字で●●たテロップをつけたサムネイルで人の関心をひこうとすることで、結果としてボーダーライン上のハラスメントの増長をひき起こしている。</p>
<p>ただ、あんまり過激に、興味をひくだけのために社会的問題になったり、はっきりした分断を助長する行為と、広告を出さなければならない企業の狙いとは相容れない。</p>
<p>ある程度までそのモラルハザード越えたと思われるコンテンツが増えると、インフルエンサーのイメージがポイズニングされる。<br />
派生した亜種の増殖によって、<strong>好感度も、その逆も、溢れかえるイメージによってコントロールされている</strong> わけなのだから。</p>
<hr />
<p>【RTメモ】Qアノン、2ch、5ch、そして8ch<br />
<a target="_blank" rel="nofollow noopener" href="https://archive.ph/oCoOU">https://min.togetter.com/wP0Vo8e</a></p>
<hr />
<p><a target="_blank" rel="nofollow noopener" href="https://0bin.net/paste/sPziOoyi#n45IhTUESxjneejIsBddo+a-B/KAwMS5m2lJa/MPgFo">youtube URL list 750 個</a></p>
<p><a href="https://crieit.net/posts/6-111">youtube 上に関連動画は、6,111 個見つかった。</a></p>
<pre><code class="pyton"># coding: UTF-8
import urllib.request
import urllib.parse
import re
import time
words = "ひろゆき"
keywords = urllib.parse.quote(words)
target = "https://www.youtube.com/results?search_query=" + str(keywords)
video_list_0 = []
already_list = []
total_list = []
id_cell = {}
video_list_0.append(target)
def first_gether(target_url,total_list,id_cell):
html = urllib.request.urlopen(target_url).read()
html_strings = html.decode()
del(html)
video_list = []
title = re.search(r'(?<=\<title\>).*?(?=\</title\>)',html_strings)
if title is None:
kakawari = re.search(r'ひろゆき|hiroyuki|西村博',html_strings)
if kakawari is None:
pass
else:
video_ids = re.findall(r"watch\?v=(.{11})", html_strings)
# video_ids = re.findall(r"watch\?v=(\S{11})", html_strings)
id_data = list(set(video_ids))
del(video_ids)
video_list = ["https://www.youtube.com/watch\?v=" + str(x) for x in id_data]
del(id_data)
else:
title_strings = title.group()
del(title)
kakawari2 = re.search(r'ひろゆき|hiroyuki|西村博',title_strings)
if kakawari2 is None:
# print(title_strings)
# print('@@@')
pass
else:
# total_list.append(target_url)
idxxx = target_url.replace("https://www.youtube.com/watch\?v=","")
print("----------------")
print(idxxx)
id_cell[idxxx] = title_strings
print('!!!',title_strings)
print('@@@',target_url)
video_ids = re.findall(r"watch\?v=(.{11})", html_strings)
# video_ids = re.findall(r"watch\?v=(\S{11})", html_strings)
id_data = sorted(list(set(video_ids)),key=video_ids.index)
del(video_ids)
video_list = ["https://www.youtube.com/watch\?v=" + str(x) for x in id_data]
del(id_data)
return video_list,total_list,id_cell
def second_gether(counter_x,url_list,already_list,total_list,id_cell):
if len(url_list) > 0:
sum_list = []
rem = []
for i,url in enumerate(url_list):
if not re.match(r'^https',url):
continue
if url in already_list:
print("----------------")
print(counter_x,';',(i + 1),';',"skip")
rem.append(url)
continue
print("----------------")
print(counter_x,';',(i + 1),';',url)
try:
video_list,total_list,id_cell = first_gether(url,total_list,id_cell)
except:
time.sleep(1)
continue
already_list.append(url)
if (len(video_list) > 0):
sum_list.extend(video_list)
total_list = list(set(total_list))
if (len(rem) > 0) :
for remove in rem:
if remove in sum_list:
inum = sum_list.index(remove)
sum_list.pop(inum)
next_list = sorted(list(set(sum_list)),key=sum_list.index)
counter_x = counter_x + 1
if(counter_x < 5):
video_list,already_list,total_list,id_cell = second_gether(counter_x,next_list,already_list,total_list,id_cell)
return video_list,already_list,total_list,id_cell
x = 0
video_list_0,already_list,total_list,id_cell = second_gether(x,video_list_0,already_list,total_list,id_cell)
del(video_list_0,already_list)
#for ind,allurl in enumerate(total_list):
# print(ind,allurl)
i = 0
for k,v in id_cell.items():
i = i + 1
print(i,' id:',k,' title:',v)
print("----------------")
exit()
</code></pre>
<p><a target="_blank" rel="nofollow noopener" href="https://rentry.co/gxu3a/raw">https://rentry.co/gxu3a/raw</a></p>
<pre><code class="perl">use strict;
use warnings;
use utf8;
use HTML::HTML5::Parser;
use XML::LibXML::QuerySelector;
binmode STDOUT,":utf8";
use Encode;
#use Data::Dumper;
my $keywords = qr/ひろゆき/;
my $useragent = "'User-Agent: Mozilla/5.0 (Linux; Android 9) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'";
my $filename1 = $ARGV[0];
open(my $fh0, '<:encoding(UTF-8)', $filenamer1)
or die "Could not open file '$filename1' $!";
while (my $row = <$fh0>) {
if ($row =~ m/^\n/){ next; }
if ($row =~ m/skip/){ next; }
chomp $row;
my $url = $row;
undef($row);
my $syscom = qx{curl -sLH $useragent "$url"};
my $mybody = Encode::decode('UTF-8',$syscom);
#my $mybody = Encode::decode('shift-jis',$syscom);
my $parser = new HTML::HTML5::Parser;
my $doc = $parser->parse_string( $mybody,{ encoding => 'utf-8'});
#my $doc = $parser->parse_string( $mybody );
undef($mybody);
my @nodelist = $doc->querySelectorAll('title');
foreach(@nodelist){
my $str = $_->textContent;
if ( $str =~ $keywords){
print $url."\n";
last;
}else{
}
}
}
close($fh0);
</code></pre>
tomato