人工知能、トップ棋士破る グーグル開発、囲碁で対戦 人の脳まねた学習威力

■　グーグル傘下ディープマインドが囲碁の世界トッププロ棋士との5局勝負で3連勝！

ある程度予想されていた結果ですが、改めて事実を突きつけられると感慨深いものがあります。生身の人間と人工知能（AI）がボードゲームで対戦する。いつまでこの構図での対立を続けるつもりなのか、という観点でも心配は尽きませんが、とりあえず、人工知能の勝利の要因を見ていきたいと思います。

前哨戦としてこういうやり取りも日本でありましたので、本編の前にどうぞ！！
⇒「人工知能、囲碁でプロ破るグーグルが開発、自ら学習し性能向上」

2016/3/10付｜日本経済新聞｜朝刊　人工知能、トップ棋士破るグーグル開発、囲碁で対戦人の脳まねた学習威力

「米グーグルが開発した人工知能（ＡＩ）「アルファ碁」と、世界トップ級のプロ棋士、韓国の李世●（石の下に乙、イ・セドル）九段との５局勝負が９日、韓国ソウル市で始まり、初戦をアルファ碁が制した。ＡＩが人間のトッププロを破る実力を備えていることが明らかになった。対戦は15日まで行われ、賞金は100万ドル（約１億1300万円）。」

（注）日本経済新聞の記事へ直接リンクを貼ることは同社が禁じています。お手数ですが、一旦上記リンクで同社TOPページに飛んでいただき、上記リード文を検索すればお目当ての記事までたどり着くことができます

（下記は、同記事添付のアルファ碁との対局の様子写真を転載）

勝利の要因は、記事では次のように伝えています。
「カギとなったのは、ＡＩの最新技術である深層学習（ディープラーニング）だ。人の脳内で進む情報処理をまね、膨大なデータに潜む特徴を自力で見つけだす。アルファ碁は、プロ棋士たちの棋譜から、どんな盤面のときにどこに石を置くべきかを学習した。
　深層学習は、12年に米で開かれた画像認識のコンテストでカナダのチームがソフトに搭載。初参加ながら圧倒的な勝利を収め、注目された。」

人間の脳内での学習機能をまねて作られた「深層学習」のアーキテクチャー。それ自体がすごいものだったら、生身の脳と電脳とのハードウェアの性能差、ということになります。果たして真実はそうなのでしょうか？

■　井山王座も「衝撃すごい」と想像を超えた勝負だった！

引き続き同記事から、日本の囲碁の第一人者、井山裕太王座が勝負をインターネットで観戦した感想を。

「アルファ碁は立ち上がりから積極的に仕掛け、人間が思いつかないような奇抜な手ではなく、「トッププロが考えそうな厳しい手」で李九段を攻めたという。「双方さすがの打ち回し」で接戦が続いたが、アルファ碁が冷静に守りを固めた後で攻めに転じ、次第にリードを広げて押し切った。」

「対局開始から３時間半で、李九段が投了した。井山王座は「はっきりまずい手があったわけではない。こう打てば勝っていたという場面はなかった。ＡＩの手には鋭さも冷静さもあり、質の高さを感じた」と振り返った。」

一方、将棋の世界はいち早く「人間VS人工知能（AI）」の勝負があり、昨年の４月の「電王戦」で最後の対決となったのですが、そこでは奇手を繰り出す人間側が団体戦初勝利で幕を閉じました。結局、アルゴリズムは人間が作るもの。それを凌駕する作戦があることと、今回は人間側が徹底的にAIの研究をしたその対策努力のたまものだったわけです。しかし、こうした「人間VS人工知能（AI）」という構図を将棋界はこれで止めにしました。

⇒「将棋電王戦　人間が初勝利で人工知能（AI）との付き合い方を考える」

（下記は、同記事添付のAIと人間の勝負の歴史を転載）

■　第2局、第3局の続報もありました。経済紙でも注目していたんですね。

対戦は、第2局・第3局と続きます。

2016/3/11付｜日本経済新聞｜朝刊　囲碁ソフトがプロ棋士に連勝　５局勝負の第２局

「【ソウル＝共同】米グーグル傘下の人工知能（ＡＩ）開発ベンチャー「ディープマインド」（英国）の囲碁ソフト「アルファ碁」と、世界トップクラスの韓国人プロ棋士、李世●（石の下に乙、イ・セドル）九段による５局勝負の第２局が10日、ソウルのホテルで行われ、アルファ碁が第１局に続き勝利した。
　アルファ碁は序盤、変則的な手を連発。中盤以降でリードし、最後まで隙を与えなかった。211手で白番の李九段が投了した。李九段は記者会見で「完敗。アルファ碁が完璧で終始リードできなかった」と語った。」

2016/3/13付｜日本経済新聞｜朝刊　囲碁ＡＩ、トップ棋士を圧倒５局勝負で３連勝

「【ソウル＝山川公生】米グーグルが開発した囲碁の人工知能（ＡＩ）「アルファ碁」と、世界トップ級の棋士、韓国の李世●（石の下に乙、イ・セドル）九段との５局勝負の第３局が12日、ソウル市内のホテルで打たれ、アルファ碁が３連勝で勝ち越した。頭脳ゲームで最も難しいとされる囲碁で、ＡＩが人間トップ級の実力を上回ったことが証明された。」

（下記は、同記事添付の李九段の写真を転載）

「残り２局は13、15日に打たれるが、アルファ碁の勝ち越しで賞金100万ドル（約１億1300万円）は寄付される。」

お金の行方は下世話ですが気になったので確認してみました。

「対局後、李九段は「期待に応えられずに申し訳ない。ただ私が負けても人間が負けたわけではない」と振り返りつつ「弱点はあるはず」と次の対局への意欲も示した。開発したデミス・ハサビス氏は「アルファ碁には天才性がある」と喜んだ。」

ここでも、「深層学習（ディープラーニング）」すごい、という解説でしたが、有識者2人の見解もちらっとご紹介。

（現地解説のマイケル・レドモンド九段）
「劣勢の終盤、李九段は難しい攻め合いに持ち込み、粘りを見せたが、「アルファ碁に正しく対応され」投了に追い込まれた。」

（井山裕太王座）
「囲碁界でも特別な存在の李九段に３連勝というのは驚きでしかない。アルファ碁は常に局面ごとの形勢を冷静に判断している印象がある」

アーキテクチャーとしての「深層学習」がすごい、じゃ説明がつかないものがそこにはどうもあるようです。

■　人工知能、自ら学ぶ能力が凄いんです！

アルファ碁に対する関心は欧米でも高いようで、Financial Times の寄稿記事や日経電子版でも海外記者による記事で次々と取り上げられています。その中でも、深層学習（ディープラーニング）、「強化学習」「自動学習」「機械学習」といったあたりのお話を。

2016/3/13付｜日本経済新聞｜朝刊　ＡＩは人知を超えるか米西海岸マネージング・エディター　リチャード・ウォーターズ

まず、チェス世界一を破ったディープブルーとアルファ碁の違いから。

「コンピューターのチェスプログラムは、何年も厳密な演算を用い、先々可能な手をすべて予期し、実行可能な最善の一手を計算することで進歩してきた。半導体の処理能力が18カ月ごとに倍増するとした「ムーアの法則」の進展がコンピューターの性能を飛躍的に高めた結果、ディープブルーが最後に人間の対戦相手を倒すのはほぼ必然と言え、勝利は時間の問題だった。」

「対照的に、ディープマインドは全く別格の技術だ。チェスと異なり、囲碁は可能な手の数が多すぎて、コンピューターが計算し切れない。その結果、機械が採用できる唯一のアプローチは、パターン認識を利用して対局がどう進展しているか「理解」し、次に戦略を練り上げ、臨機応変にその戦略を適応させることだ。だからシステムはいわゆる「深層学習（ディープラーニング）」――ＡＩにおける最も驚くべき最近の進歩の背後にある技術――を頼りにしなければならない。パターンと「意味」を模索して膨大なデータを分析すべく、人工の神経ネットワークを駆使するわけだ。」

ここまではアーキテクチャー（設計思想）の違い。さらにそれに加えて、

「ディープマインドは、システムに教えるために２つの囲碁プログラムを戦わせ、技術が反復・適応するのを助ける「強化学習」として知られるテクニックを活用した。対局では、これら２台のコンピューターは、単独ではどちらも学ばなかった戦略を編み出した。」

という運用方式の違いが非常に大きいと言えます。つまり、アルファ碁は、生身の人間とは違って、24時間365日フル稼働で、模擬対局を繰り返すことで、打ち手の最適パターンのバリエーション増大とその選択の最適化を休むことなくやり続ける点が凄いのです。よくあるスポ根漫画になる「努力と根性」。それを地でいくのが人工知能なのです。

2016/3/13付｜日本経済新聞｜電子版　トップ棋士に圧勝　「直感」身につけたグーグルＡＩ

人工知能の高い学習能力は次のようにも表現されています。

「チェスや将棋では、コンピューターが駒の配置の組み合わせの中から強いものを探し出し、どんな手を打つべきかを論理的に決めていた。それに対しアルファ碁は、「従来と全く違う、衝撃的なアプローチを採用している」（市瀬准教授）。コンピューターが人間のように学ぶ「ディープラーニング（深層学習）」技術を使い、勝ちパターンを学習するのだ。従来のＡＩは、ある局面で最善手だと信じる手を指した結果、たとえ負けても次の試合で同じ局面に遭遇すると同じ手を打ってしまう。それに対しアルファ碁は、負けた結果から「それは最善手でなかった」ことを自己学習し、同じ局面に遭遇したら別の手を指す。事前に決めていた「強い打ち手」ではなく、状況を見ながら「勝てそう」と判断した打ち手を選ぶというわけだ。」

対局中にも当然進化・学習するわけです。

「これができたのは、アルファ碁ではニューラルネットワーク（神経回路網）と呼ばれる技術の精度が高いためだ。ニューラルネットワークとは、脳を構成する神経細胞（ニューロン）をモデル化し、コンピューターで再現したものを指す。アルファ碁は、ニューラルネットワークに基づき、打ち手を探索する（ポリシーネットワーク）機能と、局面を評価する（バリューネットワーク）機能を組み合わせており、「人間に近い感覚で有望な打ち手を選んでいる」（市瀬准教授）。
　すご腕のプログラマーで囲碁とＡＩに詳しい清水亮氏（ＵＥＩ社長）は、「ニューラルネットワークによって構成されたＡＩは、ある意味で勝手に何かを学び取る。それは生物が勝手に育っていくのと全く同じ仕組みだ」と指摘する。」

生物の脳を模したアーキテクチャーで自ら考え続けることを可能にした人工知能（AI）。現在は、いわゆる「フレームワーク問題」から逃れられず、与えられた課題について、学習を進めて最適解を出すにとどまっていますが、いつの日にか、「課題設定」自体を自律的な学習の結果、得られるようになるのでしょうか。そうなれば完全にSFの世界になるのですが、そこに至るにはもう少し時間と技術の飛躍が必要なようです。

■　いつまで、「人間」対「人工知能」をやっているの？

ある領域の技術革新のために、特定期間は競争とか、対戦というのは有効な実験手法なのでしょうが、そもそもそのやり方をいつまで続けるんですか、という点についての筆者の思いで、今回の投稿を締めたいと思います。引用するのは次の著書です。

１．エージェント・アプローチ

まず、何のためにAI開発を進めているかというと、
「人間が不得意なこと」
「人間がやりたくないこと」
「人間には危険過ぎる行為」
をAI搭載のロボットに代行（エージェント）してもらおうとして、研究者もAI開発に取り組みますし、そういう社会的・経済的ニーズが背景にあるからこそ、そういうAI開発に研修資金も集まるというものです。ボードゲームで人間と対戦するって、そもそも上記の3つに当てはまっていますかね？

この著書では、AI開発プロジェクトを立ち上げるにあたって、次のような自問自答をして、プロジェクトの意義を明確にすることが紹介されています。

① 目標の具体性
このエージェントは何をするためのものなのか。その目標が具体的であればあるほど、開発プロジェクトが成功する確率は高まる

② 目標の実現可能性
このエージェントを実現するための要素技術は熟しているか。そのための人材は今、揃っているか。いなければ、どこから集めてくればいいか、等

③ 社会的に見て有意義なプロジェクトか
このエージェントは社会にどんな利益をもたらすのか

④ 時事性
なぜ今、このエージェントが必要とされているのか

⑤ 発展性
このプロジェクトからは、どんな新しい技術が派生するだろうか

⑥ 話題性、パブリシティ
このプロジェクトは世間の関心を集めることができるか

⑦ モチベーション
このプロジェクトは研究者の士気を高めることができるか

このリストを見ていると、アルファ碁は、⑥は十分でしょうね。ただし、グーグルの裏の真意からは、①②辺りは満たしているようですが。
（すみません、ちょっと問題があって、その理由まではここでは書けません）m(_ _)m

２．ジョン・ヘンリーの伝説

かつて、19世紀後半に蒸気機関が普及してきた時、現在のチェスや囲碁と同様に、蒸気機関と力自慢の鉄道労働者の闘いがあったそうです。蒸気ハンマーとジョンのどちらが、硬い岩を深く掘削できるかを競争したそうです。この競争にジョンは勝利したものの、心臓麻痺を起して死んでしまったそうです。現代の我々からすると、機械に挑んだジョンがバカのように見えるかもしれませんが、後世から見れば、AIとチェス、将棋、囲碁などで争っているプロ棋士たち（変換でどうしても「プロキシ」になってしまうのはなぜ？笑）が滑稽に映るかもしれません。

オセロで考えられる局面の総数は約10の60乗、
チェスが10の123乗、
将棋が10の226乗、
そして囲碁が10の360乗
位と言われています。

機械学習で強くなったAIに、10の360乗の闘いを生身の人間が仕掛ける行為自体には、エンターテイメント性があって、ショーイベントとして新規性があるうちは意味があるかもですが、AIの使い方としてはもっと別のスタイルがあると思います。はやく、世間も一線級のAI研究開発者を理解してあげて、もっと世のため、人のためになる直截的なAI開発にお金を出してあげるようにならないものでしょうか。

最後の最後に蛇足。ここからは趣味のお話し。

深夜アニメで「へヴィーオブジェクト」というSF戦争ものの作品（ライトノベル原作）があります。そこでは、主人公（正規軍人でなく学生の身分で軍御用達の開発者になりたい人）が、実戦投入されます。彼は、敵方兵器に搭載されている戦略AIに対して、悪知恵を働かせて、何度も勝利する姿が描写されています。お話の中では、『アンジェリナ・リスト』という論文の存在が公言されていて、完全無人の戦略AI搭載の兵器は実現不能、という設定になっています。

人が戦場で死なないための戦略AI　→　エージェント・アプローチ
『アンジェリナ・リスト』　→　人間対AIではなく、人間を補助するAI

お時間があればこちらもどうぞ！！(^^;)

■ グーグル傘下ディープマインドが囲碁の世界トッププロ棋士との5局勝負で3連勝！

■ 井山王座も「衝撃すごい」と想像を超えた勝負だった！

■ 第2局、第3局の続報もありました。経済紙でも注目していたんですね。

■ 人工知能、自ら学ぶ能力が凄いんです！

■ いつまで、「人間」対「人工知能」をやっているの？