2019-05-10に更新

Google Books Ngram Viewer で世界の中の日本を知る

スクリーンショット 2019-05-10 14.41.42.png

Google Books Ngram Viewer はその時のコーパスのなかにどれぐらいその言葉が含まれているかを時系列にグラフにしてくれるサービスです
古い言葉が使われなくなっていくのとか、新しい言葉が広まっていくのがグラフでよくみえておもしろいです、悪名高い言葉とかが意外と最近の言葉だったりしてビックリします

英語の辞書にも出てるような busi, shogun, geisha,kamikaze, ninja, sushi とかでみてみるとこんな感じで、その時代に日本がどういうふうに記載されてたのかが見えて面白いです

  • bushi って 1840年ぐらいに孤立した山があるんですけど、ちょうど外国船打ち払い令 とかやってた頃であぶねー奴らがいるぞってニュースにでもなってたんでしょうか
  • shogun って 1870年ぐらいから、まさに慶喜が退位した後 になってでてくるんですよね。いなくなってからのほうがコンテンツになるもんなんですね
  • geisha とか bushi とかがでてくるのは明治になってからの 1880年ぐらいからなんだけどなんでだろ?
  • kamikaze って 1944年に始まったんだとおもってたんですけど言葉としては 1940年からコーパスに出始めてるんですよね、作戦情報が漏れてた?
  • ninja って60年代半ば過ぎぐらいに急にでてくるんですね、何がきっかけだったんだ?その時代だと少年忍者藤丸とか?
  • sushi って80年代のバブリーな頃にゴンベルツ曲線的にポピュラーになってるんですね、案外、欧米進出した日本企業の置き土産だったりして

Google Books Ngram Viewer は英語の他にロシア語、フランス語、スペイン語、中国語など多数の言語に対応してるみたいですけど例によって日本語はありません、そもそも日本語の本のコーパスってあるんでしょうか?


Dr. Takeyuki Ueda

Je suis un Japonipais, experimants ingénieur logiciel de mobile et cloud. Ph.D en ingénierie.

Crieitは個人で開発中です。 興味がある方は是非記事の投稿をお願いします! どんな軽い内容でも嬉しいです。
なぜCrieitを作ろうと思ったか

また、「こんな記事が読みたいけど見つからない!」という方は是非記事投稿リクエストボードへ!

こじんまりと作業ログやメモ、進捗を書き残しておきたい方はボード機能をご利用ください!

ボードとは?

コメント