Skip to content

2年間のこと③ 数学とAIを学ぶ 後編

前回、数学と機械学習を勉強した話を書いて、AIには物語は書けないと結論づけたと書いた。なぜか?

人を感動させる物語は、やはり人間にしか書けない。

本当の意味での独創性は、まだ人間にしかない。

人間は、人が努力や経験に基づいて生み出したものに感動するのであって、機械が生み出したものに感動はしない。

AIには物語の神秘や奥深さは、理解できるわけがない。

これらはどれも不正解だ。そしてやや危機感が足りない。もう少しAIは、人間に肉薄している。

「コンピューター」の、古いイメージを捨てないといけない

* * *

Contents

絵画や将棋、碁の場合

今、漫画・イラストや音楽界隈ではAI技術の悪用について大騒ぎになっている。一部のアーティストは作品が機械学習のネタに使用されるから「TwitterやInstagramには作品を上げない」とまで言い始めている。そして多くの人がAIの使用停止や法整備を求めている。

海外ではAI作品だけによる美術展が開かれた。YouTubeでは数百万再生された楽曲の作者が実はAIだったとしてニュースになった。つまり十分鑑賞可能なレベルに到達しているということだ。「仕事を奪われる」ないし「自分たちの学んだ技術が盗まれる」と危惧するのは、正しい感覚だ。

なぜこんなことが可能になったのか?

前回僕が作っていた「カタカナ画像認識AI」の後に、「GAN(敵対的生成ネットワーク)」という技術が生まれて画像AIは飛躍的に進歩した。この仕組みが面白い。これは「絶対AIだってバレない画像作るプログラム」と「絶対AIの画像だって見抜くプログラム」の2つを作り、お互いを競わせながら成長させていくプログラムだ。

 

Q.この画像は現実か、AI生成か?

🤖バレない画像作るマシーン(騙そうとする) →  🖼️  ← (見抜こうとする)絶対AI見抜くマシーン💻️

※このゲームを繰り返しながら精度を上げていく

左が「生成」、右が「見抜く(探偵)」。この対決を繰り返して精度を上げていく。
https://learnopencv.com/introduction-to-generative-adversarial-networks/

こうすると、成長を自動化できるのだ。

機械は24時間走らせておいても疲れない。並行して1000台動かしていても問題ない。ただし途方もなく電気代がかかるので(GPUはやたら電力を食うから、電気ケトルやドライヤーのような電圧の高い機械を24時間動かしっぱなしにするようなものだ)、GoogleやFacebookなどカネのある企業しか実験できないけれど、放っておけばどんどん成長する。

2010年代に入って、将棋や碁という複雑なゲームでAIがプロ棋士を完敗させた。このAIにもAI同士を戦わせる手法が取り入れられていた。しかも将棋は人間の棋譜(過去の戦略)を学習していたが、碁は一切それをせず勝利した。つまり人間を負かすのに人間の知恵を必要とせず、機械同士で戦ってたら人間を越えるようになってしまったのだ。

重要なのはこの「自動化」だ。AI同士を敵対させながら成長させることができれば、あとは自動で成長する。そしてGPUと電力さえあれば、無限に成長スピードを加速できる。絵も音楽も人間を騙せるレベルになったが、物語も、この「自動化」が達成できれば自動生成まであと一歩だ。

子供の頃、ゲーム機で操作を「自動化」して無限レベルアップをした人はたくさんいるだろう

* * *

ChatGPTがやっていること

優秀な解説記事がいくらでも出ているので、ここでは誤解だらけの解説をしよう。ChatGPTは一言で言えば、文章を読み解き、生成するAIだ。人間の言語を理解させる――、この分野は自然言語処理と呼ばれ、長年研究者たちの頭を悩ませてきた。単語や文法、用例などを分析する様々なアプローチが試されたが、ChatGPTが採用したのは極めてシンプルなロジックだった。

ちょっと日本人向けにカスタマイズして喋ろう。次のかっこに入る単語を、恐らくほとんどの人はノーヒントで、間違わずに答えられるのではないだろうか?

本日は(   )なり。

吾輩は(   )である。

This is a (   ).

答えは当然、上から順に「晴天」「猫」「pen」だ。何でもヘチマもない、大体そういうもんだから……。ChatGPTがやっているのも、実は基本的にはこれと同じことなのだ。

まず何千億という文章を学習させ、「この流れなら最も言いそうなことクイズ」をひたすら出題する。正解したら褒めてあげて、失敗したら叱る。「学習の自動化」だ。そしてこれを繰り返していると、やがてほぼ100%正解できるようになる。一文で100点がとれるようになったら、二文、三文と伸ばして訓練していく。すると徐々に文脈を類推するような挙動を見せ始める。そしていつの間にか自然な受け答えができるようになっているのだ。

なーんだ、やっぱり、それは知性とは言わない。思考能力とは言わない。所詮はAI、それはただの確率じゃないか。……そう思う人もいるかもしれない。しかし僕はそう思わない。人間だってこれと同じことをやってるのだ人間は、自由に発言などしていない。その文脈や状況にあわせて、言うべきこと、言った方が良さそうなこと、言うことを期待されていることを言っているだけだ。「AIは空気読んで喋ってるだけ」、と言われれば、確かにその通りだ。しかしそれは人間も同じだ。「人間も大抵、空気読んで喋ってるだけ」なのだ。周りの人の顔色を見て、言って欲しいだろうことや、言うべきと思ったことを言ってるだけだ。また現代文の読解や「当社の前四半期の営業利益が減少した理由として考えられる要因を挙げよ」みたいな質問も文脈からの類推で答えられるし、実際、ChatGPTをちゃんと調整してやるとかなり良い答えを出す。東大入試レベルの問題ならほぼ完璧に正解できたという報告もあるくらいだ。

そんなことない? 人間は、周囲や状況に流されず、自分の考えを喋っている? ……そう思える方は幸せな人生を送っておられる。とても良いことだけれども、以後、僕の文章は読まなくていいだろう。状況や流れに合わせて真実でないことすらペラペラ喋る、それが人間だということを、僕はこれまでもたびたび書いてきた。これからも書くだろう。

ChatGPTがやっていることは、本質的に統計学なのだ。膨大にデータを食わせて、言いそうなことを言わせているだけ。ただし、だから物語を作れないと言っているわけではない。そこは誤解しないで欲しい。むしろ物語とは、データベースと異常に相性がいい。AIとは相性がいいはずなのだ。

最も感動的な「組み合わせ」を生む「確率」を上げていく

* * *

物語とAIについて

「物語は自由だ」。おそらくプロのシナリオライターや脚本家、劇作家で、こんな言葉を信じている人はいない。音楽に和音理論があり、絵画に遠近法があるように、物語にも基礎やセオリーはある。古代ギリシャのアリストテレス、中国の起承転結、近世ヨーロッパではフライターク、そしてハリウッドの三幕構成……。僕にこの話をさせると長くなる。だからAIを学んだのだ。AIと物語の構造分析、どちらも専門家レベルで理解してる人は世界中探してもほとんどいない。最もスリリングな部分の研究に携われる。

今、画像や音楽の生成AIがやっているように、物語生成AIが作れたら? ――これはもう宝の山、金のなる木だ。例えば「出演者:10名、内容:喜劇(恋愛要素あり)、長さ:100分前後、ロケ地:日本国内(できれば室内が8割)」とか条件を指定して面白い脚本を瞬時に100個くらい自動で生成できるようになれば、どうだろう? 間違いなく需要はある。締切は破るし勝手に原作は変えるし偏屈で共同作業しづらい「作家さま」などというものは必要とされなくなるだろう。

そう思って勉強を始めたのだが(ちなみにE資格は一発合格した)、ある地点で考えはストップした。なぜか。

敵対的学習ができないからだ。

画像AIや将棋・囲碁の敵対的学習がスムーズに済んだのは、敵対的学習のおかげだった。ところが物語AIを作ろうとしてもここがクリアできない。敵対的学習を成立させるには勝敗のハッキリしたゲームをやらせるか、これが本物・これが偽物とあらかじめ分類した膨大な「教師データ」が必要になる。2時間あるシナリオや戯曲を何万冊分もラベル付けした教師データなど存在しない。しかも、物語は良し・悪しだけでは判別できない。答えがない。

古くは批評雑誌、現在ならインターネットのレビューなどで、点数をつけたものは存在する。しかし純粋に脚本だけを評価したものは存在しない。小説ならまだ可能かもしれない。ただ僕は、自分がカタカナを学習させる程度でも数万もの画像データを必要としたことを考えると、とても数が足りないなと容易に予想できた。このハードルをクリアする方法は、当時は思いつかなかった。

シェイクスピアはギリシャやローマの古典に通じていた。そして「盗作」の天才だった。
面白そうな物語のプロットを借りて、書き換えた。そして生まれたのが『ロミオとジュリエット』や『ハムレット』だ。

* * *

この先の展望

とはいえまだ希望はある。先日、YouTubeが動画音声の自動翻訳サービスをスタートさせると発表した。今でもすでに字幕の自動文字起こしと翻訳は完成しているので、動画の音声はすべて瞬時に文字起こしされ、多言語に翻訳できるようになったというわけだ。しばらく精度に問題は残るだろうけど、確実に向上していくだろう。

これが何を意味するのか? ……この技術を応用すれば、過去の映画や演劇、TVドラマなど、あらゆるドラマ作品を自動でデータベース化できるようになる。刑事コロンボもロイヤル・シェイクスピア・カンパニーの記録映像も黒澤映画も、すべて自動でデータベース化できる。そしてそこに、それぞれの映像に対するレビューや評価、視聴率、視聴維持率や離脱率などのデータをうまく貼り付けて解析すれば、今はまだ不可能な「良い物語」の教師データの作成が可能になるかもしれない。

そして「分類」が可能になれば「生成」まではもう一歩だ。100%の分類ができるAIがあれば、そのAIを教師データにして、敵対的学習によるAIの訓練が可能になる。囲碁AIが世界チャンピオンを倒したように、物語AIがオスカーを取るかもしれない。トニー賞を取るかもしれない。いや確実に取るだろう。

「いやまさか、そんなことは……」

そう思う人は歴史を知らなさ過ぎる。画像分類は2010年くらいまではAIには無理とされていたがAlexNetの登場で状況が一変した。将棋だって2010年までは、一部のプロ棋士が「時間の問題でAIが勝つ」と言って呆れられていたのを除けば「コンピューターは人間には勝てない」と言われ続けていたけれど、2011年電王戦で米長邦雄将棋連盟会長(←天才)が負けてから、ドドドッと敗北に傾いた。

ちなみに「時間の問題でAIが勝つ」と言っていた数少ない棋士は、羽生善治永世七冠・現将棋連盟会長だ。そして今の将棋界の覇者・藤井聡太七冠はAIを相手に戦略を学んでいる。将棋世界の人々は「将棋だけは、まさか負けるわけがない」と聖域のように考えていた。劇や映画に関わる人が、戯曲やシナリオを聖域のように考えるだろうことは容易に想像がつくし、今はそれでいいと思う。ただし時代は変わる。

劇作家やシナリオライターが消滅するか、否か。結論が出るまでもうしばらくかかるだろう。だが僕の予想では、いくつかの技術的困難さえ乗り越えれば、そこからはあっという間だろうと思っている。

さすがに長くなったので、続きはもうやめにしておく。そんなことを勉強していた。

ChatGPTを支える技術の一つ、Attention。「どこに注目(Attention)すべきか」ということを割り出し、与えられた文章を解析する。もはやAIは「ここが重要」という要点読解に近いことさえ始めている。計算式の集合体が人間に近いことを達成している。当たり前だ。私達の脳内で行われているのはすべて電気信号のやり取りなのだから、すべて数式で書くことができるはずなのだ。(量子力学を除く)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です