木曜日, 9月 08, 2016

でぃーぷ・らーにんぐ

うら若き女子×120名を前に講義することになった。し・あ・わ・せ。。。
本当は人生とか恋愛とかを熱く語りたかったのだけれど、テーマはIT技術とのこと。
新しい話題に乏しいので、付け焼刃で人工知能の現況について調べてたら、これがなかなかおもしろい。
筋立てメモがわりにブログに書くことにした。ただ、ネタ元はネット情報だし、難しいところはすっ飛ばしてるから、内容はとても怪しい。

コンピュータが囲碁チャンピオンに勝ったとか、小説や楽曲を創作したとか、レンブラントみたいな絵を描いたとか、音楽のヒットや犯罪発生を予測するシステムができたとか、一昔前には「絶対ムリやろ!」と思われたことが、ここにきて次々と実現してしまった。画像や音声などのパタン認識系のコンテストでは、軒並みトップの成績で、しかも2位以下を大きく引き離しているらしい。
マイコン時代からコンピュータ業界の隅っこにいた自分にとっては、何だか夢のような話に感じられる。

先の例で使われた技術が、Deep Learning(深層学習)だ。
IBMのCognitiveなんちゃらや、Googleの音声認識も同じ。これまでニューロ・コンピューティング、あるいはニューラルネットと呼ばれてきた技術の進化形。

理論や数式はチンプンカンプンだが、原理はわかりやすい(言ったな!?)。脳の情報処理をモデルとし、シナプスで相互接続された多数のニューロンをコンピュータ上に構築する。
あるニューロンに入ってくる刺激の総量が閾値を超えるとそのニューロンは”発火”する。その興奮は、シナプスを介して別のニューロンに伝達される。それを繰り返すことで、特定の入力パターンに反応するニューロンを作り出していく。

例えば、「見た目で男か女かを判定する」装置を作るとする。
まず画像から髪の長さ、体形、衣装の形、靴の種類・・・などの特徴量を抽出する。ルールベースと言われる従来型の方式では、これら特徴に対する判定ルールを、「もし “髪の毛が長い” ならば 女子である確度を ”高く” する」のようなif-then形式で構築しておく。得られた特徴量に対して複数のルールを起動し、総合点を求めるような形で、元の画像が男か女であるかを判定する。

一方ニューラルネットでは、特徴量を抽出するステップは同じだが、それらを割り当てられたニューロンに入力する。各ニューロンは特徴量に応じて発火し、それが次々と別のニューロンに伝えられ、最終的に「男ニューロン」と「女ニューロン」のどちらが発火しているかで男女が判定される。最初から判定基準が設定されているわけではない。

大事なのは「学習」の過程で、テスト画像に対するシステムの判定結果を人が判定し、その正否をフィードバックする。システムは結果がより望ましい状態になるように、閾値やシナプスの感度を調整する。
これは、正解が外から与えられるという意味で「教師付き学習」と呼ばれる。
テスト画像を大量に用意すれば、確かに、うまくやればうまくいきそうな気がする。

ただ、今活躍しているDeep Learningの主役は、正解が与えられない「教師無し学習」だ。
これは何かを判定するというより、まぁざっくり言って、ビッグデータをクラスタリングする手法と考えていい。
例えば、古今東西の楽曲をニューラルネットに入力してガシガシ回していると、反応するニューロンの違いでいくつかのグループに分かれてくる。そのグループの一つを取り出して調べてみると、やたらとヒットした曲が多かったりする。そのグループを特徴づけるニューロンが、「ヒット曲判定ニューロン」となるわけだ。

つまり未知の曲を入力した時、このニューロンが反応すれば、その曲は過去のヒット曲が共通的に有していた何らかの特徴を備えていたと解釈できる。占いみたいでおもろいシステムやなぁと思っていたら、プロデューサ向けの新人発掘サービスとして、すでに実用に供されているらしい。世の中、冗談みたいなことが本当になる。

人間の神経システムでは、感覚器で知覚された生の情報は、いくつかの中間的な処理を施され、やがて言語野など高次領域で処理されるようになる。同じように、ニューラル・ネットのニューロンもいくつかの層で構成される。Deep Learningの ”Deep” は、この層が「深く」て複雑なことを示唆している。

これらのシステムでは、ある結果が得られたとしても、もはや人間はその理由を知ることができない。ルールベースなど、判定理由を人がトレースできる(つまりは、判定アルゴリズムを人が設計した)他のAI手法とは、その点が大きく異なる。

「理由がわからない」なんて気味が悪いような気もするが、もしかしたら、そのことが本質的に重要なのかもしれない。
それは、(人が下す判断の理由は、当人しか(あるいは当人にも)わからないという)リアルな知性の性質を備えているとも言えるし、だからこそ、大きな期待を抱かせるのかもしれない。

流行の火付け役とも言われる、Googleの面白い実験がある。
Youtube動画からランダムに1000万枚の画像を取り出し、これを1万6千個のニューロンと10億個のシナプスを持つニューラルネットに入力し、1000台のコンピュータを3日3晩(一説によると2週間)動かしたところ、「人間の顔」「猫の顔」「人間の身体」に選択的に反応するニューロンが「自然に」できてきたらしい。

最下層のニューロンには、人為的にあつらえた特徴量ではなく、画像のビット情報をそのまま入力しただけだから、これはまさに生き物が外界の情報を理解していく過程(の第一歩)の再現ではないか?とワクワクさせてくれる。

この研究のおもしろい(うまい)ところは、単にいろんな画像で反応を試すだけでなく、得られたニューロンが最もよく反応する画像を人工的に作り出してみせたところだ。その画像にはなかなかのインパクトがある。

Googleの猫認識」から拝借

この実験がきっかけの一つとなって、AIブームが再燃した。
それにしても解せないというか悔しいなぁと思うのは、第五世代コンピュータとかぶち上げて世界をリードしていたはずの日本のAI業界からは、とんと音沙汰が聞かれないことだ。

かつて90年前後にニューラルネットが流行ったころ、日本にも専門の研究者がゴロゴロいたように記憶している。その後、熱が冷めて研究が下火になったのは仕方ないとして、今、どこからも声が上がらないというのは、どうしたことか。変わり身の早さは研究者にとって美徳でもあるし、結果の出やすいテーマに乗り換えたくなるのもわかるけど、あまりといえばあまりという気もする。日本の研究文化には、「実用レベルにまで持ち上げる」ビジョンというか、執念みたいなものが足りないのかもしれない。応用や商用化はホントうまいんだけどね。

ところでさっき、「生き物が外界の情報を理解していく過程(の第一歩)の再現になっているかも」と書いた。この中には、意識や自我や感情の原型らしきものまでできないか、という個人的な夢も込められている。
もちろん今でも、それらの正体は、少なくとも生理学的なレベルでは解明されていない。しかしもしそれらが、記憶や判断と同じように神経組織の相互作用の効果だとしたら、人工のニューラルネットでも、似たものが生まれる可能性があるんじゃないだろうか?

コンピュータ資源を潤沢に使えるGoogleの実験でも、ニューロンの総数は1万6千個に過ぎない。ヒトのニューロンが140億個だとすると、まだ6桁もの開きがある。気の遠くなる差ではあるけれど、それがスケールだけの問題であれば、いずれ解決される。
実際、今この瞬間にも、効率良くニューラルネットを構築するための専用チップが、世界中で研究されている。
もし、ヒト並みの規模のニューラルネットが出来れば、説明のつかない変な現象が起きるかもしれない。米国防省とNASAが秘密裏に人工人格(AP)の実験を始めたらしい...そんな噂を聞く日が来るまでは、生きていたいなぁと思う。

ただ、自分で言っといて何ですが、個人的な予想としてはかなりネガティブだ。
ヒトの神経組織はデジタルで動いているわけではない。他の臓器や感覚器とも有機的に繋がっているし、「代謝」や「遺伝」や「死滅」といった生命由来の機質も備えている。意識と無意識の関係も重要だろう。それらはある意味、ヒト型知性にとって「制約」や「拘束」かもしれないけれど、同時に、意識や自我を生む源泉なのかもしれない。
結局、生命36億年の謎を解き明かさないと意識はできないのではないか?−−そんな風に思える。


0 件のコメント: