2017年11月13日月曜日

【人工知能調査】機械学習とそうでないもの

株式会社ジェニシス 技術開発事業部の遠藤 太志郎(Tacy)です。

前回にて、「人工知能とはつまるところ何か?」ということについて考察しました。
改めて纏めますと、私の考える人工知能とは以下です。

  • 人工知能とは、人間がロジックとして明示化出来ないマッチング条件を、機械に代行して作成して貰う為のツールである。

例えば、「犬と猫ってどう判別するの?」と写真を見せられた時、人間だったら、まあ大体分かりますよね。
顔つきとか、丸っこさとか……。

でもそれを「定義しろ」って言われても良く分からないし、ましてや「if文で書けるようにロジックとして定義しろ」なんて言われても無理無理。
こういう人間が感覚でやっていることは自分でも良く分からんのです。

こういう時に人工知能の出番というわけですね。

機械学習


さて、人間はどうやって「犬」と「猫」を見分けているのでしょう?
それはズバリ、経験です。

過去に犬と猫を何匹も見ているから、「犬っぽい顔をしているもの」「猫っぽい顔をしているもの」を見分けることが出来るわけです。

人工知能も同じ。

「コレは犬」「コレは猫」と決めて画像を大量投入すると、人工知能が経験を蓄積して「犬っぽいものは犬」「猫っぽいものは猫」というマッチングを行うようになるわけです。

この経験蓄積を「機械学習」「ディープラーニング」と言います。

「機械学習」と「ディープラーニング」の違いの定義は、ちょっと難しいです。

  • 機械学習を発展させたものがディープラーニング
  • 機械学習よりもオートマティックが進んだものがディープラーニング

という印象を受ける文献が多いですが、「ディープラーニングは機械学習の一部」と考えておくと良さそうです。
この連載では広義な「機械学習」で用語として統一させて頂きたいと思います。

機械学習の使いどころ


私の狙いとしては、「機械学習を業務やビジネスで生かすことが出来ないかな?」という所にあります。
そこで、もう少し「こういう時は機械学習の出番」「こういうのは機械学習不要」という判別について理解を深めていきたいと思います。

機械学習なもの:迷惑メールフィルタリング


人工知能への着目が世間に溢れてきたのは、将棋でAIがプロ棋士に勝ち始めた頃くらいではないでしょうか?
しかし実際のところ、私たちの身の回りにはもっとずっと前から機械学習の成果がありました。

例として、迷惑メールフィルタリングを挙げてみます。

迷惑メールフィルタリングの筆頭格は、やはりGMailでしょう。

そのメールが迷惑メールかどうかは、人間なら目視で判断出来ます。
大体、以下のような特徴があるイメージですね。

  • 内容が18禁である。
  • 金儲けの話が入っている。
  • 得体の知れないサイトへ誘導されている。

大体こういうイメージですが、特に「これ!!」って断定する条件は無いですよね。
こういう時こそ、機械学習の出番です。

昔は上司のメールが迷惑メールフィルタリング行きってことが頻発していましたが、最近は昔よりもそういうケースが減ってきたように思います。

長年の蓄積により、GMailの迷惑メールフィルタリングがどんどん成長しているのですね。
成長こそが機械学習の特徴です。

機械学習ではないもの:ウイルスメールフィルタリング


同じメールフィルタリングでも「ウイルスメールフィルタリング」は機械学習ではありません。

私はウイルスバスターを使っていますが、あれはトレンドマイクロ社員が「パターン定義ファイル」というものを毎日ガリガリ作っているんです。

「ウイルスと判定するための条件」がキチッと決まっています。
こういうものは機械学習ではありません。

  • 迷惑メールフィルタリングは、機械学習の成果である。
  • ウイルスメールフィルタリングは、機械学習ではない。

同じメールフィルタリングでも裏側の機能は別物です。
両者を「似たようなもの」と考えてしまう人がいるとしたら、言語道断です。


このように、


  • 人工知能と機械学習を投入するべきところ
  • 昔ながらの人間による定義で処理するべきところ


これらの違いが分からなければダメということですね。

「これからは人工知能の時代だ」という話は良く聞きますが、世の中の全てが人工知能に置き換え可能なわけではありません。
「どの辺りが人工知能の使い所なのか?」ということを理解した上で検討していきたいものです。

終わりに


こういう記事を書いていると、「そう言えば、アレって機械学習使えないのかな?」とか思う時があります。

例えばですね、最近「メルカリ」というフリマアプリが人気ですよね。
あれは不正出品が多発して治安が問題になっているとニュースになっています。

メルカリ社員が24時間体制で不正出品を監視しているそうですが、「機械学習で不正出品の自動検知したり出来ないのかな?」と思うところです。
迷惑メールフィルタリングが出来るのだから、不正出品フィルタリングも出来ると思うのです。

実際に機能を実現するとなったら大変でしょうし、もしかしたら既にメルカリ内部では動き出しているのかもしれません。

でも、こう考えるだけでも、色々と可能性がありそうな技術ですよね。

さて、機械学習についてイメージが沸いてきたところで、そろそろ「具体的にどう実現したら良いの?」という所に迫っていきたいと思います。

0 件のコメント:

コメントを投稿