「ディープラーニング」の記事 - Crieit

AI時代はアナログ人材を不要にするか問題

2019-12-10T22:37:42+09:00

はじめに　AIの未来とアナログ人材

普段、平日はRを使いごりごりと。最近、Pythonも勉強し始めました。（遅）

東大の松尾教授の研究室で公開されている演習コンテンツページとか見ると、ありがたいなぁと思いつつ…これを10代、20代前半でガシガシやってのける東大生ってやっぱすごいわと思うこの頃です。社会人でも応募できるDL4USとかも魅力的。

学生のときは文系の研究室にいて組織論研究に身をささげてきたこともあって、
データ分析を生業にしながら、「AIが人の仕事を奪う」とか「AI時代の人材教育」なんて聞くと色々考えてしまいます。

かつて日本が製造業のものづくりで、トップにたっていたのは1980年代くらいまででしょうか。
いまや海外から見た日本と言えば、テクノロジー分野の後発が多く、魅力的なイノベーションを生む土壌が弱いような。

アナログのものづくりできらりと光ってた国内人材スピリットはどこへやら…
デジタル、デジタルって言われて久しいけど、結局アナログ人材は要らんのか。

そんなことないよなぁと思いつつ、徒然にAI時代の人材活用論について備忘録を残したいと思います。

(引用：松尾研監修のディープラーニング無償講座(下図))

日本のAI実践活用　世界での立ち位置は

東京大学大学院教授兼日本ディープラーニング協会理事長の松尾豊氏は今や日本でAi投資、ビジネスを企てるソフトバンクグループ取締役でもあります。

近年、人工知能（AI）やディープラーニングのビジネス活用については聞かない日はないほどですが、企業における実践的な活用という点では日本は米国、中国と比較して大きく遅れをとっています。

そんななかで積極的なディープラーニング（深層学習）のビジネス活用を推進するソフトバンクグループに学術的権威の松尾氏が加わるというニュースは、いよいよ日本におけるディープラーニング活用が本気になってきたという希望を感じずにはいられません。

少し前になりますが2019年6月8日に開催された、Microsoft・Preferred Networks協同運営のディープラーニングコミュニティイベント「DEEP LEARNING LAB（DLLAB）」内での松尾氏の基調講演でも日本国内のAI導入 / ディープラーニング活用は世界的に見ても遅れをとっていることが強調されました。

その背景と今後の改善点として挙げられていた5つの観点は

小さな成功体験をすること
AIチーム編成の重要性
AIトレーニングの必要性
明確なAI戦略
内部・外部のコミュニケーション（IR / GR[Government Relations] / 顧客育成 / 人材獲得 / 社内コミュニケーション）の重要性

と明確に述べられており、まさしくと感じる観点ばかりです。

日本企業のディープラーニング活用　苦戦の背景は

上記の5つの課題点に加えて、外資系IT勤務時代にから聞いたリアルな声を総合してみると日本企業の実態は以下のようなのではないかと思います。

AIの導入効果を立証できない（小さな成功体験の不足）→投資を引き出せない・社内理解がない（内部コミュニケーション不足）→AIチーム編成/トレーニングは二の次 →目的設定のないまま「何か」からはじめようとする（AI戦略・外部コミュニケーション不足）→安価なトライアルから始める→検証段階で頓挫→AIの導入効果を立証できない…

この無限ループから抜けたもの勝ちでビジネスが成功していくように思います。これを眺めていると、戦略的AI / ディープラーニング活用のために最初に打つべき手としては
• 投資の確保と適切な投入
• 実践経験豊富なAI人材の獲得

がキーになりそうです。

一点目は、各企業の経営層の手腕だったり、まさしくソフトバンク社「ソフトバンク・ビジョン・ファンド」のようなファンド事業会社の取り組みだったりが問われるところです。

二点目のAI人材の獲得ですが、ここが国内企業の一番の課題と言えそうです。なぜなら優秀な人材獲得のためには、パフォーマンスを発揮するための環境、社内業務側との連携体制、顧客育成のためのブランディングなど戦略的かつ組織的な見直しを伴うためです。

近年増えているAI人材に「日本企業」を選んでもらうためには多くの課題が残っています。国内の優秀な人材からすると活躍の場は米国、中国、欧州といったテクノロジー先進国にも広がっているためです。海外ではAI人材獲得の前に「育成」という観点からすでに企業各社の戦略が光っています。

ここのところ特に、海外ではiSchoolが人気を集めていたり、「STEM教育」という言葉が注目されたりしているように、多くの学問でテクノロジー思考やデータ活用による論理的アプローチが重要視されており、AI時代に有用な人材を育てる気風があります。

対して、2020年からやっと小学校でプログラミング教育が始まる日本。

「AI=プログラミング」という短絡さもさることながら、数歩先を行く欧米、アジア諸国からAI時代の人材育成の根本を学ぶ必要さえ感じます。

「IoT / モジュール化」の時代に光るアナログ人材

STEM教育が注目される中で「アナログ人材」**もここへきてスポットライトを当てられるべき存在ではないかと思うのです。

ここでいうアナログ人材とはものづくりをハード面でかなえるスペシャリティのこと。
コーダーだってデータサイエンティストだってものづくりしてますから！！

クラウド化が進んで市場は圧倒的にソフト面に偏るように見えても、IoT、ウェアラブル端末によるデータ取得が増える今後、どれだけ小型なハードウェアを作れるかというのは腕の見せ所です。

しかし、近年のデジタル（ソフト）人材の需要の高まりによって市場では圧倒的にアナログ人材が不足しているとか。

結果、電子部品のハードウェア開発のトレンドも複数の機能をひとつにまとめる「モジュール化」が流行っています。

例えば、データや通信機器、産業機器、医療機器などの中核としていわば「脳ミソ」の役割をするプロセッサー。
これに電力供給をする降圧コンバータであるDC-DCコンバーターの例をとってみると、アナログ人材の不足が背景で、DCDCコンバータ回路を構成する抵抗器・コンデンサーなどをまるっとひとつにして時短で実装できるというかたちが流行っているといいます。

人材不足を受けて、より効率化の方向にものづくりのやり方自体がなびいてしまっているようにも思います。

かつて日本の製造業、ものづくりを支えた職人はもっと強いこだわりを見せていたのではないかと考えを巡らせてしまいます。

作りたいもの、が第一にあり、それを叶えるための組織と戦略がついてくる。

これからのAI時代における日本の返り咲きは「プログラミングがあーだ、こーだ」言う前にこんなこだわりの見直しが必要なのかもしれないですね。

まさにこれからが日本国内でのAI・ディープラーニングビジネスの正念場。
各社の投資、人材教育に向けた取り組みには、引き続き注目していきたいものです。

参考：　AI活用成功のための「打ち手」を探る

AIメーカーを支える技術（AIメーカーの作り方）

2018-12-23T21:48:33+09:00

この記事は個人開発サービスに用いられている技術 Advent Calendar 2018 の22日目です。

こんにちは、2z（Twitter： @2zn01 ）です。

普段は会社員でWeb系の開発エンジニアとして働き、週末に趣味で個人開発をしています。

今年の7月に話題のAIをweb上で誰でも気軽に作れる「AIメーカー」というサービスをリリースしました！

■AIメーカー
https://aimaker.io/

この記事では、この「AIメーカー」で使っている技術をまとめたいと思います。

作ったもの

以下の３ステップで誰でも簡単にAIを作れます！

AIに覚えさせたいタグを入力
タグから自動で画像データを収集
AIがデータから学習

今話題のAIをweb上で誰でも気軽に作れる「AIメーカー」を開発しました！①AIに覚えさせたいタグを入力②タグから自動で画像データを収集③AIがデータから学習の３ステップで誰でも簡単にAIを作れます！動画では手相占いのAIに挑戦！みんなもAIを作って遊んでみてね！https://t.co/66DFU7GRZ2 pic.twitter.com/ie1LmioyA1
— 2z＠AIメーカー (@2zn01) 2018年7月19日

画面イメージ

学習データの登録画面

学習データを各ラベル名から自動で収集する機能を実装！これはなんとAidemyの石川さん(@ai_aidemy)よりアドバイス頂いたアイディアです！大感謝！！僕も最近始めたところですが、Aidemyは機械学習、ブロックチェーンなど最新の技術も勉強できておすすめです！https://t.co/gORhd5P7Ls #AIメーカー pic.twitter.com/2cNpjzjPAl
— 2z / AIメーカー開発 (@2zn01) 2018年7月8日

モデルの学習画面

複数AIのモデル学習を並列で走らせる対応も無事完了！（処理の裏側では複数のGPUサーバが走っている）学習には時間がかかってしまうため、エポック数(訓練データを何回繰り返して学習させるか)は500に調整し、10分以内には終わるように。精度よく学習させたい人は応相談にしておこう#AIメーカー pic.twitter.com/ukM3sg9rNG
— 2z / AIメーカー開発 (@2zn01) 2018年7月7日

モデルの学習履歴

学習履歴を一覧表示して、グラフを切り替えれるようにしてみた。#AIメーカー pic.twitter.com/wxcxZ3HXLE
— 2z / AIメーカー開発 (@2zn01) 2018年7月8日

モデルの推論結果画面

AIメーカーの診断結果へ無駄にグラフを追加してみた！#AIメーカー pic.twitter.com/YCTaBDawhh
— 2z / AIメーカー開発 (@2zn01) 2018年7月14日

システム構成図

AIメーカーのシステム構成図は以下の通りです。

大きな構成としては、主にユーザからの様々なリクエストを受け付けるフロントサーバと機械学習の処理を取り扱うバックエンドサーバの2つがあります。

使用している技術

Linux

クラウドのホスティングは、Amazon Web Services（以下、AWS）をメインで使用しており、Amazon EC2でサーバを立てています。
サーバのOSはLinuxでAmazon Linux 2を使っています。

Amazon EC2

AWSがメインですが、文字起こし機能の方ではGoogle Cloud Platformで、Google Compute Engine（GCE）でサーバを立てています。
サーバのOSはLinuxでCentOSの7系を使っています。

Google Compute Engine

なぜAWSの他にGCPも使っているかというと、文字起こし機能の方でGoogle Cloud Vision APIやGoogle Cloud Speech APIを使っており、大容量の音声ファイルや画像ファイルを取扱うのにGoogle Cloud Storage経由で使った方が都合がいいからというのが理由になります。

Apache

webサーバはApacheを使っています。
Nginxもありますが、Apacheは普段から使っており、設定も把握していたため、いつも通りの安定の選択としました。

Apache

MySQL

Amazon RDSを使ってMySQLを立てています。

Amazon EFS

複数のインスタンスで学習データや学習済みモデルを共有できるようにAWSのAmazon EFSというネットワークファイルシステムを使っています。

Amazon EFS

AIメーカーではフロントサーバとバックエンドサーバで分かれており、そこの連携が肝になってきます。
そこでAmazon EFSを使うことで、全インスタンスで同じファイルを共有することができるので、めんどいことを考えなくてもよくなります。

サーバをスケールさせる際に問題となってくるのがデータが格納されるDBとファイルになるかと思います。
Amazon EFSを使うことでファイルの読み込みや書き込みの速度は犠牲になるため、ユースケース次第かと思いますが、この辺の問題を考えなくてもよくなります。

ただ、ストレージ料金が高いのが悩みの種です。。＞＜

PHP

フロントサーバ側のプログラムはPHPを使って実装しました。
フレームワークはZend Frameworkを使用しています。

Python

バックエンドサーバ側のプログラムはPythonを使って実装しました。
フレームワークはFlaskを使用しています。

Python
Flask

Caffe

Deep LearningのフレームワークはCaffeを使用しています。

Caffe

jQuery

クライアント側のJavaScriptは、jQueryを使って実装しました。

jQuery

実装方法

AIメーカーを作るにあたって、一般的なwebサービスにはない機能をどう実装しているかをご紹介します。
主に以下の機能について、まとめてみます。

学習データの自動収集
モデルの学習
モデルの推論

学習データの自動収集

ディープラーニングで画像分類のモデルを作る際には、AIにこの画像は〇〇であるということを教えるため、学習データにラベル付けを行います。
この学習データのラベル付けは、モデルの精度に大きく影響する重要な作業ですが、単調な作業なためにとても退屈です。

そこで、AIメーカーでは事前に登録していたラベル名から画像データを自動で収集する機能を用意いたしました。
ちなみにこちらの機能はAidemyの石川さんよりアドバイス頂いた機能です。大感謝！

学習データを各ラベル名から自動で収集する機能を実装！これはなんとAidemyの石川さん(@ai_aidemy)よりアドバイス頂いたアイディアです！大感謝！！僕も最近始めたところですが、Aidemyは機械学習、ブロックチェーンなど最新の技術も勉強できておすすめです！https://t.co/gORhd5P7Ls #AIメーカー pic.twitter.com/2cNpjzjPAl
— 2z / AIメーカー開発 (@2zn01) 2018年7月8日

ラベル名からの画像データの収集は、Bing Image Search APIを使用しています。
一つのラベルごとに50件の画像データを収集するようにしています。

この学習データの収集はブラウザからAjax通信でリクエストを投げ、サーバ側でバックグラウンドで処理させています。
処理時間はラベル数によりますが、少なくとも数分はかかるので、単純にリクエストを投げて応答を待っていると通信がタイムアウトしてしまう可能性があります。
そこで、サーバ側にリクエストを投げたら一度データベースへその処理をタスクとして保存しておき、一旦ブラウザ側へレスポンスを返しています。

サーバの裏側では常にデーモンが監視（待機）しているので、データベースへ学習データの収集タスクが登録されたら、収集処理が開始されるようになっています。
また、ブラウザ側では定期的にその進捗状況をAjax通信で見に行く（ポーリングする）ようにしています。

なお、AIメーカーでは手軽に利用できるように学習データの自動収集機能は用意しておりますが、それだけだと質の良い学習データは用意できないため、JPG、PNG、ZIPによる画像データのアップロードにももちろん対応しています。

モデルの学習

モデルの学習といえば、AIメーカーの根幹の機能になります。登録された学習データをもとにモデルを学習させます。

先のシステム構成図で示しましたが、AIメーカーにはフロントサーバとバックエンドサーバがあり、モデルの学習はバックエンドサーバで行います。
具体的には以下の流れで行います。

１. フロントサーバ側で学習データに不足がないかチェック

２. フロントサーバ側でCaffeで学習を開始するのに必要なファイルを生成する

deploy.prototxt、solver.prototxt、train_val.prototxtを生成
学習データのファイルパス、ラベルのテキストデータを生成（全データのうち、90％を学習に使用）
テストデータのファイルパス、ラベルのテキストデータを生成（全データのうち、10％をテストに使用）

３. フロントサーバ側からAmazon EC2のGPUインスタンス（バックエンドサーバ）を起動する

既に作成済みのインスタンスがある場合はそのインスタンスを起動する
まだ起動済みのインスタンスがない場合は新たにインスタンスを作成して起動する

４. インスタンスの起動後、セットアップスクリプトを実行（具体的には以下のことをやっています）

Amazon EFSのマウント
最新のソースをGitHubからpull
FlaskをuWSGIサーバで起動し、リクエストを受付できるようにする

５. バックエンドサーバへの疎通確認後、フロントサーバからバックエンドサーバへCaffeの学習開始のリクエストを投げる

６. バックエンドサーバ側でリクエストを受け、Caffeの学習コマンドを実行する

LMDBの作成
　　リストファイルは先の2で生成しておいたテキストデータを指定します。
　　EFSでファイルを共有しているため、そのままファイルの同期とか考えなくてもそのまま使えます

convert_imageset -resize_height=227 -resize_width=227 -shuffle / {学習データのリストファイル} train_lmdb
convert_imageset -resize_height=227 -resize_width=227 -shuffle / {テストデータのリストファイル} test_lmdb

平均画像の作成

compute_image_mean train_lmdb mean.binaryproto
compute_image_mean test_lmdb test_mean.binaryproto

学習を実行
　学習ログファイルへ進捗状況が出力されていきます

caffe train -solver=solver.prototxt -weights {モデル} 2>&1 | tee {学習ログファイル}  &")

７. フロントエンドサーバ側で学習ログファイルから進捗状況を把握し、学習状況をグラフで表示

学習ログファイルはAmazon EFSで共有しているので、そのログの中から正規表現でせっせと該当値を抽出します

if (preg_match('@]     Test net output #0: accuracy = ([0-9.e\-]+)@', $record[$i], $matches)) {
    $accuracy = rtrim(rtrim(sprintf('%F', $matches[1]), '0'), '.');
}
if (preg_match('@]     Test net output #1: loss = ([0-9.e\-]+)@', $record[$i], $matches)) {
    $loss_test = rtrim(rtrim(sprintf('%F', $matches[1]), '0'), '.');
}
if (preg_match('@] Iteration [0-9]+, loss = ([0-9.e\-]+)@', $record[$i], $matches)) {
    $loss_train = rtrim(rtrim(sprintf('%F', $matches[1]), '0'), '.');
}

８. 学習完了後、バックエンドサーバ側でモデルが生成される

９. フロントサーバ側でログから学習完了を検知し、学習結果をデータベースへ保存し、EC2インスタンスを停止する

以上が処理の流れになります。

モデルの推論

学習が完了し、生成されたモデルを使って画像分類の推論を行う機能です。
こちらは以下の処理で行っています。

１. ユーザーさんが推論したい画像をブラウザからアップロード

２. フロントサーバで画像データを保存し、バックエンドサーバへ画像ファイルパスをパラメータに推論のリクエストを投げる

３. バックエンドサーバでリクエストを受け、Caffeで推論処理を実行し、結果をJSON形式で返す

４. フロントサーバでレスポンスを受け取り、推論結果をグラフで表示する

最後に

今回、特にAIメーカー特有の機能に絞って、実装方法をまとめてみました。
AIメーカーではフロントサーバとバックエンドサーバの複数インスタンスで構成し、それぞれを連携させて実現している箇所が多いため、多少複雑になっています。

実際に作ってるときは頭の中でシステム構成をイメージして実装を進めていますが、後で見返すとどうだったっけな？となることがほとんどです。
このへんはきちんとメモするか、図解するかしてきちんと残しておいた方がよさそうですね。

なお、AIメーカーでは誰もが手軽にシンプルに使えること、そして学習が早く終わるようにするため、現時点ではモデルの精度を犠牲にしています。

そのため、今後は精度向上のために学習の際のハイパーパラメータのチューニングをしたいとか、学習の回数をもっと増やしたいとかなどの要望に応えられるようにする必要があると感じています。

学習自体はサーバ側でGPUを使ってやってます。ただ、まずは手軽に利用できるように学習時間を大幅に削減するべく、本来もっと学習すべきエポック数を少なくしてるので、精度はそんなに出ないのが現状です。こちら、精度を上げたい方はオプションでパラメータ調整を可能にしたり等、今後の課題です！ https://t.co/ZNfOUGxtS9
— 2z / AIメーカー開発 (@2zn01) 2018年7月21日

今後、このあたりの機能拡張も行っていきたいと思います。

この記事に少しでも興味をもって頂けましたら、ブログの読者登録やTwitter： @2zn01をフォローして頂くと更新の励みになります！

皆さんもぜひ自分のサービスを作っていきましょう！