グレートクソアルゴリズム | くだらない youtube アルゴリズムを使用して youtube ビデオに関する情報を収集するくだらない Ruby プログラム

2022-11-10T19:08:50+09:00

クソアルゴリズムにたいして、クソアルゴリズムを利用して、必要なものだけを選別していくものを書いてみる。

え、突然なに ? と思うかもしれないが、やっぱり怒ってるんだな。
これじゃないロボってわかるかなぁ。

欲しかったロボはこれじゃない！世界中から子供たちの悲痛な叫びが聞こえる情操教育玩具。グッドデザイン賞受賞の伝説的玩具。
コレジャナイロボ（The Original Model）
https://www.assiston.co.jp/1595

わかんないと思うな。

コレジャナイユーチューブ

何を怒っているか整理すると、Youtube 検索結果について。

簡単に言うと、探したいものがあって、探してるときに、あなたの探してるものと関係ありそうなもの教えてあげる的に頼んでもない集合知をほいって添えられて、それを断るすべがないということについて。

探しているものがはっきりしていて、その言葉で検索かけているときに、ほいっ、あなたの前回見た動画から他の人が見たのこれだから、こんなの面白いみたいよ、どぞー !! って検索結果に混ぜられるの意味あると思うのか ?? まともに考えて。それ、おすすめ映画をレコメンドするアルゴリズムだよね。それ、バカでしかないからやめてほしいんだ。

それ、バカでしかないからやめてほしいんだ youtube . . .

例えば、ransomware というキーワードで検索したとして、それと前回たまたま見た何かの動画とは全く関係ない趣向で、今検索してるのに、じゃあこれもって一言も ransomware のことなんて発言しない youtuber のたくさん視聴された関連動画を検索結果に混ぜてくるのって、「機械学習してるからー」てことを人間が配慮してあげないとしたら、意味不明のバカでしかない。

意味不明のバカでしかない . . .

意味不明のバカな結果を出すアルゴリズムを権威的に出してくるって、意味不明なバカレベルである。だから、やめて、と思うだけなんだな。
他人の行動も、過去の自分のトレンドも全く関係がない TPO が読めないアルゴリズムって、ただの邪魔だ、ということ。
そんなことは当たり前過ぎるのに、なぜか当然のように諦めさせらるとっても不毛なシステムだ。
これがなんでもかんでも Collaborative filtering 。

この配慮のない他人の行動をどんなときにも当てはめようとしてくる様式をクソアルゴリズムと呼ばずにはおれない。

でも、クソとかバカとかいうのも、どうにもならないわかりきったことで、単に Google が正しくキュレーションされたものより、てっとりばやく消費される季節ネタのようなバズを見えるとこに置いた方が広告の流入になるという方針なだけで、そういった正攻法はかつて創業者によって「情報の精度が落ちる要因」とされているので、クソなことをわかってやっていて、かつて 2000 年代に蔓延したアホみたいなインデックス型のサーチエンジン並みのクオリティを実現するアルゴリズムを新参のカウンターとして、知的に駆逐した彼ら google 自身が「今」作っているということ。

The Age of PageRank is Over
09 Nov, 2022
Vladimir Prelovac
CEO, Kagi Inc.
https://blog.kagi.com/age-pagerank-over

もちろん、そんな 20 年以上レイドバックしたテクは 22 年以上前の板フロート掲示板王子によってチートされている。「クソをクソだと見抜けない人が使っている」ということが、クソの臭い嗅ぎ王子には見透かされたと言っていい。たぶん、世界中同じような状況じゃないかと思う。だって、結局古いんだもん。

というところまででクソアルゴリズムを悪く言うのはここまでにして、じゃあ、どうすればいいの ?
自分の決めたキーワードとの関連はどうやって判断するのか ? を考えてみる。

キーワードと youtube 動画の相関は、タイトルにキーワードが含まれるか ? だけで判断するということにする。

含まれていたら、関連動画としてリストに追加するし、含まれていなければそれ以上関係性を考慮しない。これだけのストレートなルールを設定する。
なので、youtube 動画のタイトルが web ページのデータ上のどこにあるのかを割り出すことが必要。

キーワードで youtube 検索するには、

https://www.youtube.com/results?search_query=ransomware

で、get する。そうすると、検索結果を表示するリダイレクトが youtube ページで行われる。

この行為を Ruby コードで書くと、

code : 01

require 'uri'
require 'net/http'

words = "ransomware"
keywords = URI.encode_www_form(search_query: words)
target = 'https://www.youtube.com/results?' << keywords
resp_0 = Net::HTTP.get_response(URI.parse(target))

ページのなかの、