誰でもわかる”機械学習”の基礎の基礎

"誰でもわかる"シリーズ

最近、至る所で“AI”という言葉を耳にしますね。大学で研究されているロボットだけではなく、生活家電の中にもAIは広く使われるようになってきました。2010年から第三次AIブームが始まったと言われており、若干下火になりつつも2021年の現在に至るまで、まだそのブームは続いています。第三次AIブームは“機械学習の時代”とも呼ばれており、この”機械学習”という技術が鍵となっているわけです。

AIとは一体何か?
機械学習とは一体何か?


なんとなく難しい技術というイメージがあると思いますが、実はそんなことありません。パソコンさえあれば、あなたでもAIを使った“解析”や”ものづくり”をすることができます。もちろん、一から仕組みを作り出そうとすれば、それは大変なことでしょう。しかし、実際にAIに触れたり、利用したりすることは決して難しいことではないんです。AIや機械学習は、専門家だけが使うものではなく誰もがツールとして使うことができるものになるでしょう。いや、もうそうなり始めています。

AIや機械学習の知識が、ものづくりの必修科目になる日も近いかもしれませんね。そうなる前に、本記事を読んで、AIや機械学習の基礎をフワッと学んでおきましょう。誰にでもわかるように、できる限り噛み砕いて説明しますよ!

では、さっそくいきましょう!!

AIってなんだ?

AIとは、Artificical intelligenceの略です。日本語で言う“人工知能”という意味ですね。では、実際にどんな機能を持ったものをAIと呼ぶのでしょうか。実はこのAIという言葉・・・明確な定義は存在しないんです。作った人が「これはAIだ!」と言ったらAIということになります。

とは言え、一般的な共通認識としては、AIは

人間のように思考や判断をするコンピュータシステム

と言えるでしょう。またAIは大きく2つの種類に分けることができます。それが強いAI弱いAIです。

まず、強いAIとは、それこそSF映画に出てくるようなAIです。人間のように、一人で自由に様々なことを考えて判断していくことができます。わかりやすくいうなら、ドラえもんですね。ドラえもんのように意識を持ち、人間と同じような思考や判断ができるAIを強いAI、また汎用AIと言います。ただし、この強いAIはまだ実現はできておらず、現実には存在しません。AIがたどり着くべき終着点とも言えるかも知れません。

一方、弱いAIとは、限られた領域の中のみで判断を行うことができるAIです。代表的なのは、チェスや将棋のAIですね。決められたゲームのルールの中で、最適な解を見つけることだけに特化したAIです。それ以外のことは全くできません。このように一つのことのみに特化させたAIを弱いAI、また特化型AIと言います。最近、家電を始めとして色々なところで耳にするAI技術とは、この弱いAIのことを指します。

ちなみに,ドラえもんのような強いAIを実現するために乗り越えなければならない課題として“フレーム問題“があります。フレーム問題とは、「限られた処理能力しかない人工知能は、現実に起こりうる問題全てに対処することができない」という問題のことです。ちょっと難しい定義ですが、わかやすく説明します。

例えば、強いAIを持つメカトロザウルス君(このブログのマスコットキャラ)「醤油を買ってきてくれ」と頼んだとしましょう。買い物に出かけ、商品棚を前にしたメカトロザウルス君はこう考えます。

醤油の種類はどれが良いのか?
塩は買わなくても良いのか?
砂糖は買わなくても良いのか?
おやつは買ってもいいのか?
野菜は買わな(略

このように、強いAIが課題を前にすると、考えることができる全ての可能性について判断しようとしてしまいます。そして、その思考に入った瞬間に動かなくなってしまいます。なぜなら、考えることは無限にあるため永遠に考えることになってしまうからです。

人間であれば、醤油を買いに行ったのに、「野菜は買わなくても良いのか」とは考える必要がないことはわかります。しかしAIは、何を考えなくて良いのかという、線引きが判断できずに全ての可能性に対して判断を行います。その結果として無限の思考に陥ってしまうというわけです。

AIにとっては、思考すべきことのみを枠(フレーム)で囲うように選び出すことが難しいのです。これが強いAIの前に立ち塞がる壁、フレーム問題です。

仮に、「醤油を買うために判断する必要があることだけを選び出せ」と最初に指令したとしても、醤油を買うために判断する必要があることを選ぶために、再び無限の思考を行ってしまうためイタチごっこになってしまうんです。 そのため、現実では最初からガッチガチに思考のフレームを決めて、判断すべきことを極限に限定したAIしか作ることができません。それが弱いAIなんですね。

弱いAIというと劣った感じがしてしまいますが、実際はそんなことはありません。人間のようにあらゆる判断はできませんが、特化した分野に関しては人間を圧倒的に凌駕するほどの能力を発揮するんです。AIについて、概要を理解したところで、次は機械学習について学びましょう。

機械学習ってなんだ?

生まれたてのAIは、何も教えなければ赤ちゃんと一緒です。いくら処理能力があっても、知識や情報がなければ何かを思考することも判断することもできません。そんな赤ちゃんAIを立派に育てるために行うのが機械学習です。

少し小難しく定義すると機械学習は

AIが人間のような高度な判断を実行するのに必要な「法則」をコンピュータ自身に探させる方法

と言えます。私たちは普段、頭を使って何気なく考えたり、判断したりしています。実はこれは極めて複雑な作業なんです。

例えば、一枚の写真を見て、「そこに映っているのが猫か犬か判断をする」としましょう。人間であれば、まず間違えることはありません。猫は猫、犬は犬と判断できるはずです。もしコンピュータに写真を見せて、人間と同じような正確な判断ができれば、それが人工知能ということです。

ですが、これが一筋縄ではいきません。この判断をさせるためには、まずコンピュータに猫と犬の違いについて教える必要があります。ここで質問ですが、犬と猫の違いってなんでしょうか?

なんとなく感覚ではわかりますけど、言葉にするのは難しいですよね。

大きい方が犬で、小さい方が猫 → 小さい犬は猫?
鼻が長いのが犬で、短いのが猫 → フレンチブルドックは猫?


と言った具合で、犬と猫の違いは無限にあります。これを一つ一つ人間の手で教えていたらキリがありません。そこで登場するのが機械学習という学習手法です。

機械学習では、データさえ渡せばコンピュータが勝手に学習してくれます。いうならばテキストだけ渡して自習させる感じです。犬と猫の違いを判断するAIを作る場合、犬と猫の大量の写真を用意して、それをコンピュータに与えるだけです。すると、コンピュータが勝手に犬と猫の特徴を判断し、理解していきます。人間が言語化できない違いでも、コンピュータが特徴を数値化して自分なりの法則を作っていきます。その法則に従って、判断を行うわけです。

ざっくりしたイメージが掴めたところで、機械学習の種類について見ていきましょう。

機械学習の種類

機械学習には大きく分けて、教師あり学習教師なし学習があります。

教師あり学習

教師あり学習とは、あらかじめ大量のデータと答えを用意しておいて、それをコンピュータに学習させる方法です。例えば犬と猫を判別するAIを作るなら、大量の犬と猫の写真とこの写真に写っているのが猫であるか、犬であるかという答えをペアで渡します。このデータと答えのペアを、まとめて“教師データ“と呼びます。同じように犬、狸、狐など・・・色々な教師データを与えることで、AIは様々な動物を判別していくための法則を自ら学んでいきます。

そして学習を終えたAIに、動物が映った写真を見せれば、機械学習によって得た法則に基づいてそれがなんの動物であるのかを判断してくれます。このようにコンピュータが法則と照らし合わせて答えを予想することを”推論”と呼びます。教師あり学習は、予想する答えの種類によって二つに分けれます。

●回帰
数値を予想するための教師あり学習
例:過去1週間の売り上げを渡して、今週の売り上げがいくらになるかを予想する。

●分類
種類を予想するための教師あり学習
例:未知の生物の画像を渡して、それが犬か猫かを予想する。

教師あり学習のAIで面白いと思った活用を一つ紹介します。それが、パッケージデザインAIです。お菓子のパッケージなどをAIを使って評価できるウェブサービスです。画像をアップロードすれば、大量の学習データから導き出した法則に従って、そのパッケージデザインの評価を行ってくれるというサービスです。

カルビーのポテチを売上1.3倍にしたAIの正体--プラグの「パッケージデザインAI」の実力
カルビー、ネスレ日本、森永乳業など、日本を代表する食品メーカー各社が導入しはじめているAIツールがある。マーケティングリサーチとパッケージデザインを展開するプラグが2年前にリリースした「パッケージデザインAI」だ。

このように、人間ではパッと答えが出せないような問題に対して、明確な回答をくれるのがAIの強みだと言えるでしょう。人間は犬か猫かをすぐに判断することができますが、デザインパッケージが良いか悪いかはすぐには判断できませんよね。しかし学習を終えたAIにとっては、犬猫の判断も、デザインの良し悪しの判断も全く同じものなのです。

ただし教師あり学習の場合、教師データは人間が集めなければなりません。つまり、教師あり学習では必ずデータと答えがある問題しか取り扱うことができないのです。しかし、現実の問題は答えがあるものばかりではありません。そこで利用されるのが、教師なし学習です。

教師なし学習

教師なし学習は、教師データなしで機械学習を行う方法です。教師データなしと言っても、全くデータを与えない訳ではありません。答えのついていないデータのみをコンピュータに与えて学習させます。動物の判別AIの例でいうなら、その動物が何かは問わずにとにかく動物の写真データを大量に与えて学習させます。答えのない問題に対して、AIに考えてもらおうと思った際はこの教師なし学習を使います。教師なし学習には、クラスタリング次元削減があります。

●クラスタリング
クラスタリングとは、与えられたデータを似ているもの同士でグループ分けをする方法です。動物の判別AIの場合、答えを与えている訳ではないので動物の種類を判別することはできません。ただ動物の種類はわからなくても大量の写真データの中から、共通点を探し出してグループ分けをすることができます。人間には見分けが付かないようなものも、このクラスタリングを使えば分類することが可能です

●次元削減
次元削減とは、文字通りデータの次元数を減らす事です。ここでいう次元とは、データのことです。つまり、複数のデータを一つのデータにまとめて表現する方法が次元削減です。例えば、国語、数学、理科、社会、英語という5教科の成績があったとしましょう。次元削減を使うと、国語、社会、英語は文系能力、数学、理科は理系能力という具合で数値の関連性を見つけ出して、まとめることができます。

このように教科の例だと、機械学習を使うまでもありません。ただ実際のデータはもっと複雑で、多数の次元を持っています。次元削減を使うことで、人間では見つけることのできない複雑なデータの中の関連性を見つけ出すことができ、分析と視覚化が非常に楽になるわけです。


教師無し学習では、絶対的な正解がないため、AIが弾き出した結論が正しいかどうか判断する術がありません。よって、一般的にAIとして用いられるのは教師あり学習の方です。教師なし学習は、教師あり学習のための教師データが準備できない場合に用いられる学習方法と言えるでしょう。

深層学習(ディープラーニング)ってなんだ?

補足ですが、最近何かと話題のディープラーニングについても軽く触れておきましょう。よく機械学習やディープラーニングは混同されて使われますが、ディープラーニングは機械学習の手法の一部であり、分類上は“教師あり学習“の種類の一つとなります。

教師データとして、人間が自然に行う行動やタスクを学習させます。大量の教師データを、ディープニューラルネットワークという人間の脳に近い構造を持つシステムで学習させることで、人間に近いより精密な判断が可能となります。

ディープラーニングの技術の基礎は20世紀には開発されていましたが、コンピュータの性能が追い付かないこと、また学習データが集まらないことで、学習が進まず性能も上がりませんでした。しかし、近年のコンピュータの発達やインターネットの普及により、十分に学習されることができる環境が整ったため、ディープラーニングが再び脚光を浴びるようになったわけです。

機械学習に触れてみよう!!

AIや機械学習の概要を理解するだけでなく、実際に触れてみることをオススメします。私は下記の教材を使って機械学習を勉強して、実際に触れてみました。この教材はそれなりのボリュームがありますが、かなりかみ砕いた説明で初心者にもわかりやすいので超オススメです。プログラミング言語Pythonを用いて、機械学習を実際に使いながら学ぶことができますよ。ちなみに本記事も、この本に書いてあることを参考にして執筆しています。

AIや機械学習というと、自分とは関係のない遠い技術だというイメージを持っている人も少なくないでしょう。冒頭でも言いましたが、AIや機械学習は誰もがツールとして使うことができるものになると思います。現時点でも、パソコンさえあれば誰でも使えるわけですからね、食わず嫌いせずに一度体験してみると良いと思います。むしろ、やらない理由がないといっても過言ではありません。

前提として、Pythonの基礎知識くらいは持っていた方が理解しやすいので同じ出版社からでているこちらの教材で勉強するのもよいでしょう。

AIに対する漠然としたイメージが、身をもって体感することでかなり具体的にイメージできるようになりました。仕組みから完全に理解しようと思ったらなかなか難しいですが、掻い摘んで使うだけならそんなに難しいことはないんです。是非、触れてみてくださいね!!

まとめ

本記事を復習しましょう。

・AIとは、人間の思考や判断を再現したコンピュータシステム
・機械学習とは、判断に必要な「法則」を、コンピュータに学習させる方法
・機械学習には、教師あり学習と教師なし学習がある
・教師あり学習には、回帰、分類がある
・教師なし学習には、クラスタリング、次元削減がある
・ディープラーニングは機械学習の一部


AIを体系的に学ぶことで、AIが決して遠い存在ではないということがわかります。それと同時にAIに期待していたSFチックな夢が打ち砕かれて、ちょっと複雑な気分ですね。やっぱりAIと言ったら、ドラえもんなどの自分の意思をもって、人間のように行動するイメージが強いですからね。

我々が生きている内に強いAIが実現されるのかどうか・・・これは非常に楽しみな課題でもあります。本記事で説明した“フレーム問題“もありますが、それを乗り越えても次は倫理の問題があります。ロボットが反逆するというSFおなじみのアレですね。創作とはいえ、SFはあなどれませんよ。SF作家アイザック・アシモフ氏の作中で登場するロボット三原則は、現実のロボット工学に影響を与えたほどですからね。

せっかくなので最後に、オススメのSF小説を紹介して本記事の結びとさせていただきます。人間と人工知能の違いは何かをテーマにしたSF小説の代表作です。面白いですよ!!

created by Rinker
¥644 (2021/09/26 04:10:03時点 Amazon調べ-詳細)
タイトルとURLをコピーしました