AlphaGoZeroが人の歴史を再構築してしまった話

AlphaGoZeroがビッグデータ棋譜データ)を使わずに、強化学習だけで圧倒的に強くなったという話が話題です。

こちらの論文要約がとても分かりやすくてためになります。
blog.livedoor.jp

そこで気になるのがこの冒頭の箇所。

人工知能の多くの進歩は人間の判断を真似るように学習させることで行われてきた。しかしそれをさせるためには莫大で高価なデータが必要だった。しかも、たとえそれが手に入ったとしても、それがそのシステムの上限を決めてしまう。そこで強化学習を用いることで人間の限界を超える人工知能を作ることにした。

これはつまり「人間の棋譜を使わなくても強い」のではなくて、「人間の棋譜を使わない方が強い」ということです。結果的に、圧倒的に強い囲碁AIが誕生しました。

これについてはいろいろな見方があります。


という感じに、人が新しい世界へ飛び立つためのポジティブな現象として捉えることも出来そうです。

僕はこれについてはけっこうネガティブな見方をしています。ネガティブかポジティブかというのは、囲碁界に良い影響を与えるかどうかという意味です。


クリエイティヴィティとは

僕がネガティブになる理由ですが、僕はたぶん一般的な認識よりも歴史というものの存在を重く見ているためだと思います。新しい自由な発想、クリエイティヴィティというのは何なのかと考える時に、新しい発見というのは全て歴史の再解釈であるという考え方です。

個人的に元をたどれば間テクスト性という理論に影響を受けて、こういう風に考えるようになりました。
間テクスト性 - Wikipedia

人にとって、全く新しい何かを考え出すことは(身体的偶然性を除けば)原理的に出来ないようになっていると思います。僕らが考えることが出来る範疇の全ては、歴史からの引用によって構成されていて、歴史のパーツを分解/再構成することで新しいものを生み出す、というのがクリエイティヴィティの正体だと思います。

これは10年前だと文学研究者でもなければなかなか受け入れ難かった考え方だと思うのですが、ここ数年のDNNの発展により、考えるということは歴史(ビッグデータ)そのものなのではないかという認識は普及してきたのではないかと思います。色々な新しい手を打ち続けているAlphaGoにしても、それらの新しい手というのは膨大な棋譜データの先に導かれるものなのです。

AlphaGoZeroによって作り直された歴史

さて、AlphaGoZeroに話を戻しますと、この囲碁AIは囲碁のルールだけが与えられている状態から、膨大な数の自己対戦を繰り返すことによって、未だかつてない強さを手に入れました。

これはどういうことかというと、AlphaGoZeroが全く別の囲碁の歴史を構築したということです。

強化学習の効果を測るために、人間の真似をする教師あり学習をしたネットワークを作って比較したが、強化学習のネットワークの方が強かった。

論文にもあるように、この状態のAlphaGoZeroは「人の棋譜を入力するよりしない方が強い」という状態になっている可能性が高いと考えられます。

この状況を簡単に言えば、囲碁というゲームにおいて、人が数千年かけて作ってきた歴史よりもAlphaGoZeroが短期間で作った歴史の方が正しい可能性がある、ということです。


そこで、AlphaGoZeroがより良い別の歴史をパラレルワールド的に作ったと仮定した場合、これはおそらく人類として初めて直面する問題なのではないかと思うわけです。

  • 我々は歴史の延長線上でしか考えることが出来ない
  • 我々の歴史よりも正しい歴史がAIによって作られてしまった

こういう時に人はどういう態度をとるべきかは難しい問題です。見て見ぬふりをして人類の歴史を紡いでいくか、AIが作った歴史の延長線上で思考することが出来るくらい新しい歴史を研究するか。その中間に落としどころを作り出すか。

これから囲碁棋士の方々は、この全く新しいタイプの問題に対して、人類最初の挑戦者として挑んでいかなければならないのかもしれません。そしてこの問題は、将来的にあらゆるクリエイティブな局面に現れるでしょう。