2019-08-10に更新

著名なアニメ監督150人の名前を調べようぜ☆(^~^)?

150人調べるハック☆(^~^)

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 別の畑に首を突っ込むときはまず その業界の著名な150人を調べるハック をやろうぜ☆? まずは アニメ監督 から☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 何だぜ それ☆?」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 社会学の方から来た経験的数、プログラマーに分かるように言えば マジック・ナンバー の 150 で、
飯食って顔を思い浮かべたり、どう動いているか想像しながら一緒に仕事できる人の上限数 ぐらいに思っていい☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 直接目の見えるところに指示を出して動かせる人の上限数 は マジック・ナンバー 30 なんで、
全体で 40人 いれば 1班を20人にして 2班体制にする、とか 社会学の経験からくる数は 指針として利用される☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 チームのメンバー数が1番多いスポーツって何なの?」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 ラクビーの15人☆ 2チーム対戦するわけだから、競技場に 30人 同時に動いているわけだな☆
ちょうど マジックナンバー 30 だぜ☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 営業マンで ラクビーやってて体力がある、というだけでなく、この 30人を見る目 は 仕事の役に立つわけだぜ☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 班長に向いてそうよね」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 で、説明は はしょって メタファーを使って言うと、 その業界の1流と やり合う には
自宅にある1500枚のカードの中から 150枚のカードを選んでポケットに入れて出かけて、
戦いが始まる直前に その場で 30枚のカードを選び出して それだけで戦う、みたいなことが 必要になるぜ☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 カードゲームやってんのか……☆」

アニメ監督一覧を収集しようぜ☆(^~^)?

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 数の理論の根拠や その効果の有用性の説明は ほどほどに はしょって さっさと進もう☆
グーグルに アニメ監督一覧 と入れるだけで ずらーっと顔が並ぶぜ☆
肖像権どうなってんだ……☆」

20190810ani74a1b1.png

20190810ani74a2b1.png

20190810ani74a3b1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 なぜか グーグルに アニメの作画監督 に翻訳し直されて 51人 出てきた☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 99人足りないな☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 わたしは 水増し と やっつけ仕事 を得意とするプログラマーなんで☆」

20190810ani75a4b1.png

20190810ani75a5b1.png

20190810ani75a6b1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 キーワードを アニメーション監督一覧 にするだけで メンバーがちょっと変わる☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 べつに 画像にこだわらなければ 名前の一覧ぐらいあるのに……☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 Wikipediaの記事は人間が編集しているが、グーグル検索は SEO対策の結果が出ている☆
たくさん載っていると 逆に その中から選ぶことが むずかしい☆ これは初歩的な悪手だぜ☆
うまいやつは、うまくバラついてピックアップしてくれる道具を選べだぜ☆」

20190810ani75a7b1.png

20190810ani75a8b1.png

20190810ani75a9b1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 キーワードを アニメ作家一覧 に伸ばして 水増し しよう☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 統計データとして精度を うんこ にしてくれたな☆」

資料を作ろうぜ☆(^~^)?

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 じゃあ ソートするが……、なんだ この検索画面 名前を引っこ抜けないな……☆ 右クリックしてHTMLソースを表示☆」

20190811ani77a.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 うわっ、汚いコードだぜ☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 フル・オートマで人名だけ取り出すプログラムを書くのは大変なので……☆」

20190811ani78a1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 人名が書いてある範囲を 適当に選択して web-site.txt とでもいうファイル名で保存☆
Ajax でも使っているのだろう☆ 画面に表示されている部分よりちょっと大きめの範囲分 ぐらいのデータしかないようだぜ☆」

tag-off.py

import re

# ファイルをオープンする
test_data = open("web-site.txt", "r", encoding="utf-8")

# すべての内容を読み込む
contents = test_data.read()

# HTMLタグを消す。
contents = re.sub(r"<[^>]*?>", "", contents)

# 内容を表示する
print(contents)

# ファイルをクローズする
test_data.close()

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 あとは HTMLタグ を外すスクリプトを書いて実行☆」

20190811ani78a2.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 人名だけ 取れてるな☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 めんどくさ……☆」

# HTMLタグを半角スペースに変換。
contents = re.sub(r"<[^>]*?>", " ", contents)

# 2つ以上連続する半角スペースを、改行に変換。
contents = re.sub(r" {2,}", "\n", contents)

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 ちょっと改善☆」

20190811ani78a3b1.png

KIFUWARABE_80x100x8_01_Futu.gif
「 さすが やっつけ仕事の達人だぜ☆
裏で ちょこちょこ 手作業 で直していても プログラムの達人の ふり をしているよな☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 プログラミングに詳しい人なんか 開発チームの外には いないですからね。
運用で ごまかせるのよ」

20190811ani79a1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 データの修正とかは最後でいいぜ☆ Excel にコピペしろだぜ☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 Excel を使っているだけで 仕事をしている感 があるよな☆
Excel で コンピューター将棋を作って 遊んでた証券屋もいるらしいぜ☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 あとは 手作業で繰り返すだけ☆ ここを自動化できないのは まあ 自分の技術レベルと相談した結果だな☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 あれっ、HTMLソースに 名前が載ってないやつがいるぜ☆?」

KIFUWARABE_80x100x8_01_Futu.gif
「 Ajax だからな☆ 動的読込(あとから更新)なのだろう☆」

20190811ani79a2b1c1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 じゃあ [F12] キーの開発者モードへのショートカットを使って 動的に変更されたHTMLを 引っこ抜くだけだぜ☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 日本政府から禁止されそうよね。やることがないときは とりあえず何かを 禁止にしておけば 実績になるのよ」

KIFUWARABE_80x100x8_01_Futu.gif
「 モザイクから元の顔を復元する技術が発達したら お父んは肖像権侵害な☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 まだ発達してない☆ まだ大丈夫☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 SCzBxCNarKLWU……とかいう分けわからない文字、ひょっとして画像データなの?」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 おそらく そうじゃないか☆? そうでなければ難読化コード☆ わたしには どうでもいいぜ☆」

20190811ani80a1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 1ページずつ変換するのではなく、 1つのファイルに HTMLソースを3回貼り付けて 一括変換しろだぜ☆
そして Excel に張り付けると、重複のことを考慮すると 100人ぐらいは 名前が取れたんじゃないか☆?」

KIFUWARABE_80x100x8_01_Futu.gif
「 150人には足りてないが、まあ いいかだぜ☆」

20190811ani80a2.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 フィルターかけて 重複を除去してから 名前の崩れの修正や、ノイズの除去をする☆
ソートすれば 漢字が何順か分からないが、とにかく 並ぶぜ☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 人類は データのソート が苦手なので、こういうところは コンピューター に任せるのが うまくやる方法だぜ☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 時短だな☆」

20190811ani81a1b1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 こんな感じで Excel と照らし合わせながら カードを確認しているので 1時間ぐらい 待て だぜ☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 時短じゃないな☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 この作業 要らなくない!?」

20190810ani82a1b1.png

20190810ani82a2b1.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 被りを削って、HTMLソースから多めに拾ったのを追加すると 116名 あるな☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 アニメ監督 という人物は ノイズだと思う☆」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 150と、115じゃ、 76% しか満たしてないわよ?」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 じゃあ 76% で進めようぜ☆
ところで Wikipedia の記事は 全然 正しくないことで有名だが、だったら アンサイクロペディア の公開情報を調べていこうぜ☆?」

KIFUWARABE_80x100x8_01_Futu.gif
「 座学かだぜ☆?」

animator.csv

20190810ani82a3.png

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 ヘッダー付きの CSV を作成し☆」

ansaikuropedia.py

import pandas as pd

animator_df = pd.read_csv("./animator.csv")
names = animator_df["NAME"].values.tolist()

print("""
|Name|
|----|""")

for name in names:
    # Deletes space.
    keyword = name.replace(" ", "")
    print(
        "|[{0}](https://ansaikuropedia.org/index.php?search={1})|".format(name, keyword))

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 pandas で CSVのデータを抽出するぜ☆
markdown形式のテーブルの形に出力してしまおう☆ あとは リンクを踏んで確認だぜ☆」

ansaikuropedia.py

import urllib
import pandas as pd

animator_df = pd.read_csv("./animator.csv")
names = animator_df["NAME"].values.tolist()

print("""
|Name|Ansa|Nico|
|----|----|----|""")

for name in names:
    # Deletes space.
    keyword = name.replace(" ", "")
    # Escape.
    keyword = urllib.parse.quote(keyword)
    print(
        "|{0}|[Ansa](https://ansaikuropedia.org/index.php?search={1})|[Nico](https://dic.nicovideo.jp/s/al/t/{1})|".format(name, keyword))

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 アンサイクロペディアだけでは記事があんまりないので ニコニコ大百科も追加しよう……☆」

Name Ansa Nico
あずまきよひこ Ansa Nico
アニメ監督 Ansa Nico
アミノテツロー Ansa Nico
イシグロキョウヘイ Ansa Nico
うえだしげる Ansa Nico
うえだひでひと Ansa Nico
うるし原智志 Ansa Nico
えんどうてつや Ansa Nico
カサヰケンイチ Ansa Nico
こだま 兼嗣 Ansa Nico
ことぶきつかさ Ansa Nico
りんたろう Ansa Nico
わたなべひろし Ansa Nico
芦田 豊雄 Ansa Nico
安田 朗 Ansa Nico
安彦 良和 Ansa Nico
庵野 秀明 Ansa Nico
磯光雄 Ansa Nico
羽原信義 Ansa Nico
影山 楙倫 Ansa Nico
永野 護 Ansa Nico
押井 守 Ansa Nico
黄瀬 和哉 Ansa Nico
岡崎 稔 Ansa Nico
岡村 天斎 Ansa Nico
沖浦 啓之 Ansa Nico
河森 正治 Ansa Nico
貝澤幸男 Ansa Nico
垣野内成美 Ansa Nico
角銅博之 Ansa Nico
岸 誠二 Ansa Nico
岩崎良明 Ansa Nico
亀垣 一 Ansa Nico
吉田 竜夫 Ansa Nico
宮崎駿 Ansa Nico
宮本 幸裕 Ansa Nico
京田 知己 Ansa Nico
錦織 敦史 Ansa Nico
金子ひらく Ansa Nico
九里一平 Ansa Nico
古橋 一浩 Ansa Nico
五十嵐卓哉 Ansa Nico
荒牧 伸志 Ansa Nico
荒木 哲郎 Ansa Nico
荒木伸吾 Ansa Nico
高橋 良輔 Ansa Nico
高畑 勲 Ansa Nico
今 敏 Ansa Nico
今石 洋之 Ansa Nico
今川 泰宏 Ansa Nico
佐藤 卓哉 Ansa Nico
佐藤元 Ansa Nico
斎藤 博 Ansa Nico
桜井 弘明 Ansa Nico
笹川ひろし Ansa Nico
山村浩二 Ansa Nico
山田 尚子 Ansa Nico
山内 重保 Ansa Nico
志水 淳児 Ansa Nico
寺田 克也 Ansa Nico
芝田 浩樹 Ansa Nico
手塚 治虫 Ansa Nico
秋山勝仁 Ansa Nico
出崎哲 Ansa Nico
出淵裕 Ansa Nico
勝間田 具治 Ansa Nico
小原 正和 Ansa Nico
小島 正幸 Ansa Nico
小野 学 Ansa Nico
松本 零士 Ansa Nico
伸一?鈴木 Ansa Nico
新海誠 Ansa Nico
神戸守 Ansa Nico
神山 健治 Ansa Nico
水島精二 Ansa Nico
杉井 ギサブロー Ansa Nico
石原 立也 Ansa Nico
石黒 昇 Ansa Nico
石田敦子 Ansa Nico
石浜真史 Ansa Nico
石平信司 Ansa Nico
石立太一 Ansa Nico
赤根 和樹 Ansa Nico
川尻善昭 Ansa Nico
川本喜八郎 Ansa Nico
浅香 守生 Ansa Nico
村野守美 Ansa Nico
太田 雅彦 Ansa Nico
大沼心 Ansa Nico
大森貴弘 Ansa Nico
大地丙太郎 Ansa Nico
大張 正己 Ansa Nico
大塚 隆史 Ansa Nico
大友 克洋 Ansa Nico
長井 龍雪 Ansa Nico
貞本義行 Ansa Nico
渡辺明夫 Ansa Nico
湯山 邦彦 Ansa Nico
湯浅 政明 Ansa Nico
湯浅 政明 Ansa Nico
梅津泰臣 Ansa Nico
白土 武 Ansa Nico
飯田 馬之介 Ansa Nico
美樹本 晴彦 Ansa Nico
富野 由悠季 Ansa Nico
平池芳正 Ansa Nico
平野 俊貴 Ansa Nico
米たに ヨシトモ Ansa Nico
片渕 須直 Ansa Nico
北爪宏幸 Ansa Nico
北野英明 Ansa Nico
麻宮騎亜 Ansa Nico
木上 益治 Ansa Nico
木村 隆一 Ansa Nico

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 どんぶりを犬に舐めさせて食中毒になってしまう押井監督と もっと間近で見たいと国鉄小海線の列車の前に飛び出して警笛を鳴らされてしまう新海監督 面白いな……☆」

KIFUWARABE_80x100x8_01_Futu.gif
「 話し半分に読めよ☆」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 しかし ほとんど記事立ってないな☆ 作品の記事は ちらほらあるが、監督が記事になってると思う方が変なのかだぜ☆?」

OKAZAKI_Yumemi_80x80x8_02_Syaberu.gif
「 Wikipedia は情報はいっぱいでも 信憑性がないから 読んだら 悪い癖が付きますからね」

KITASHIRAKAWA_Chiyuri_80x100x8_01_Futu.gif
「 くそっ 手塚治虫の記事だけで 全体の半分ぐらいありそう☆(^~^) スクロールバーのスライダーが全然下に行かない☆(^~^)」

<書きかけ>

ツイッターでシェア
みんなに共有、忘れないようにメモ

むずでょ

光速のアカウント凍結されちゃったんで……。ゲームプログラムを独習中なんだぜ☆電王戦IIに出た棋士もコンピューターもみんな好きだぜ☆▲(パソコン将棋)WCSC29一次予選36位、SDT5予選42位▲(パソコン囲碁)AI竜星戦予選16位

Crieitは誰でも投稿できるサービスです。 是非記事の投稿をお願いします。どんな軽い内容でも投稿できます。

また、「こんな記事が読みたいけど見つからない!」という方は是非記事投稿リクエストボードへ!

有料記事を販売できるようになりました!

こじんまりと作業ログやメモ、進捗を書き残しておきたい方はボード機能をご利用ください。
ボードとは?

コメント