巨大なオープンソースデータ、研究ツール“StarCraft”のリリースが一般知能の鍵となる

8月7日、FacebookのAIチームは、StarCraft:Battle for Mother Nestゲームの史上最大のデータセットをリリースしました。8月10日、DeepMindとBlizzardは共同でStarCraft 2のゲームデータセットとAIトレーニングプラットフォームSC 2 LEをリリースした。

DeepMindとFacebookがStarCraftに恋に落ちた理由

先週、AI業界では多くの大きなイベントがありましたが、2つのAI巨人の関心を集めたのはStarCraftだけでした。

8月7日、FacebookのAIチームは、StarCraft:Battle for Mother Nestゲームの史上最大のデータセットをリリースしました。8月10日、DeepMindとBlizzardは共同でStarCraft 2のゲームデータセットとAIトレーニングプラットフォームSC 2 LEをリリースした。

なぜDeepMind、Facebook、AliなどのAI巨人がStarCraftの研究に夢中になったのか?なぜ彼らは人間の競技者に勝つために人工知能を作るのではなく、オープンソースのデータと研究ツールの公開の道を歩んだのでしょうか。

さらに、AIに関心のある人なら誰でも気づいていると思いますが、多くのメディアや専門家は、StarCraftの研究がAIを汎用知能へと導くことができると信じています。しかし、ほとんどの説明は明らかではありませんが、StarCraftと一般知能の論理的な関係は何ですか?StarCraftはAI巨人をどのように魅了したのでしょうか?

詳細な分析を始める前に、トップAIエキスパートはゲーマーではなく(少なくとも仕事では)、AIがゲームをするという事実自体は彼らにとって何の価値もないという常識を繰り返さなければなりません。囲碁におけるAIの成功は、AIの強さを誇示したり、アジア諸国の伝統文化を侮辱したりするものではありません。

AlphaGoが囲碁を選んだのは、この知的スポーツが暴力的ではなく、AIの非計算能力をテストできるからです。例えば、AlphaGoの最終版では、レイアウト能力、抽象的な状況に対する判断力、さらには具体的な行動における創造性など、従来のコンピュータにはなかった能力を示しています。

AI研究者にとって、ゲームは目標ではなく方法です。AI企業の目標は2つしかありません。1つはより良いAIを作ること、もう1つはそれを売ることです。しかし、ゲームにはAIのトレーニングに自然な実験室の性質があります。データに裏打ちされ、成功と失敗の基準が明確で、大量の人間のトレーニングデータが利用可能です。

このコンセンサスがあれば、AI巨人のStarCraftの計画を解読し始めることができます。しかし、最初のステップは、AI企業がStarCraftで何をしているのか、そしてその目的は何かを理解することです。

DeepMindとFacebookはStarCraftに何をしているのか?

まず、FacebookとDeepMindが今回非常に“トランペット”の意味を持つアクションで何を投稿したかを見てみましょう。

時系列では、まずFacebookです。簡単に言えば、Facebookは60,000以上のコンテンツを含む365GBのゲームデータセットをリリースしました。もちろん、このデータは人間のためのものではなく、機械学習タスクのトレーニングに特別に使用されるデータです。

特に注目すべきは、Facebookが発表した論文でこのデータの汎用性を強調したことです。異なるアルゴリズム、異なるプラットフォームに適応でき、比較的標準化された機械学習トレーニングデータを提供します。

DeepMindでは、物事は少し複雑になります。彼らは『マザーネストの戦い』ではなく、より高度な『スタークラフト2 』をターゲットにしている。DeepMindは、SC 2 LE(StarCraft 2 Learning Environment)と呼ばれる統合AIトレーニングツールキットをリリースしました。

このパッケージには、StarCraft 2の機械学習環境に特化した4つのアイテムと論文が含まれています。

まず、DeepMindはブリザードから回収された65,000の匿名ゲームを含むゲームデータセットを提供した。将来的に増加し続ける。

第二に、ブリザードが開発したStarCraft 2の機械学習プログラミングポータルをリリースし、研究者や開発者が自分のエージェントをゲームに接続できるようにしました。

さらに、DeepMindは独自のPySC2ツールキットをオープンソース化し、研究者がエージェントを簡単に訓練できるようにした。

最後に、パッケージにはStarCraft 2から抽象化された拡張学習ミニゲームが含まれています。これらのミニゲームにより、研究者は特定のシナリオでエージェントの効果を簡単にテストできます。

このように、DeepMindとBlizzardの科学者は、主食だけでなく、さまざまな食器やデザート、食品の説明書を送信するより親密です。

しかし、DeepMindもFacebookも目標は1つだけです。できるだけ便利で快適な研究環境を提供し、StarCraftの最先端のAIトレーニングにより多くの開発者を引き付けることです。

その根底にある動機は、StarCraftのようなゲームのアクションやシナリオは無限大であり、1つの会社の人員では徹底的な開発や実験を行うことはできないということです。したがって、より多くの研究者が基本的なステップをスキップして最先端の特定のアクションアルゴリズムやマルチタスク協調スキームを直接研究できるようにするためのオープンソースとデータ共有が、現在のAI企業の真の焦点です。

このアクションのアイデアは、リアルタイムストラテジーゲームの特殊性に由来します。ここでもう一つの質問に答えましょうなぜスタークラフトなのでしょう?

なぜスタークラフトなのか。

ディープラーニングなどのAIシステムのトレーニングには、ミニゲーム、サンドボックスゲーム、リアルタイムストラテジーゲームの3つのゲームが最も使用されています。しかし、これら3つのうち、ミニゲームとサンドボックスAIは単一のエージェントとして機能します。リアルタイムストラテジーゲームだけがユニークなトレーニング機能を提供します:複雑さと協調。

Open AIのAIがDota 2のトッププレーヤーを打ち負かしたばかりで、ムスクは興奮してツイートしました(ところで、AIの脅威について言及することを忘れていません)が、他の多くのAI巨人の科学者はかなり軽蔑しています。

その理由は、Dota 2の1 V 1モードでは、AIは1つのエージェントにしか適用できず、目標は比較的単一であり、1対1の遭遇は不完全な情報ゲームではないからです。スピードと人間の反応は間違いなくAIと比較され、Open AIのこのAIの価値は、ゲームのルールを学習するためのシステムにあります。

大規模なリアルタイムストラテジーゲームは、非常に異なる環境を持っています。

1、複雑で変化する環境は、エージェントが大量の環境情報空間、時間、データの変化を理解する能力をテストします。

多くの独立したユニットとのコラボレーション。人間のプレイヤーが“マイクロ操作”と呼ぶ技術は、AIのコアテストである複数のユニット、建物、フォーメーションの協調動作能力をテストすることです。

不完全な情報ゲームですこのようなゲームは戦争の霧で始まり、相手の動きを観察できません。エージェントにはレイアウトと長期的な判断が必要です。

これらの特徴により、リアルタイムストラテジーゲームは既知のAI実験の中で最も複雑な環境の1つになります。AIの目標は勝つことではなく、勝つことです。

“スタークラフト”でなければならない理由については、いくつかの理由を要約することができます。

まず第一に、ブリザードはオープンソースAIを構築する意欲を持っており、“スタークラフト”自体の素材とインターフェースも非常にスムーズです。ゲーム全体のデータ化コストは非常に低い。

第二に、戦闘効果や画面を持つリアルタイムストラテジーゲームと比較して、スタークラフトの競争力が強いです。アクションが多く、要素が複雑で、囲碁のように暴力的な計算では分解できない基本的な特徴を持っています。

同時に、強い競争属性と長い競争の歴史のために、“スタークラフト”の戦術と戦略の議論は非常に豊富であり、各サブアクションの価値は基本的に判断の基礎を持っており、これは機械学習システムの前提条件の一つです。

これら3つのポイントに加えて、実際には最も重要な理由があります。StarCraftは最大のリアルタイムストラテジーゲームであり、BattleNetなどのプラットフォームは非常に完全です。言い換えれば、AIに十分なトレーニングデータが残されています。

AI巨人の本当の目的

は、オープンソースのクラウドソーシングモデルを採用することを好むだけでなく、“スタークラフト”の超複雑なトレーニング環境を征服することですが、AI巨人は十分ですか?彼らはそこから何を得るか?

DeepMindがStarCraft 2をミニゲームのシリーズに分解した原理に従って、逆にしてください。AI企業が望んでいるのは、次から次へと細かいアクションを解読し、それらをまとめてエージェントの大きなコレクションを形成することです。このコレクションは、無数のソリューションだけでなく、それらの背後にある普遍的な機能を結集します。

囲碁と比較すると、StarCraftのトレーニング環境から囲碁では得られない少なくとも4つの能力を推測することができます

。ボードゲームとは異なり、リアルタイムストラテジーゲームでは過去の情報が完全に抹殺される可能性があります。例えば、さっき作った兵が死んでしまったのですがしかし、その情報が次の物語を左右します。そのためには、AIが記憶を持ち、その記憶を使って対策を講じる必要があります。メモリへの迅速な適応は、新しい商業的価値のあるAI機能になります。

弱い情報環境での長期計画能力:前述のように、StarCraftのようなゲームの開始は完全に情報に閉じられています。最初にしたことは戦争の結果とは全く関係がないかもしれませんが、真の因果関係があります。このような人間特有の長期計画·調整計画能力は、機械の予測·判断能力に対応しています。

複数のエージェントが協力する能力。人間のようなキーボードとマウスを使って、1つのエージェントが端末上で多数のエージェントと協調するように指示する方法は、間違いなく興味深いトピックです。戦略的な犠牲、おとりの設定、集中火力でさえ、現実社会におけるAIの将来の中心的な役割とは対照的です。

4、アクションの一貫性:ゲームをプレイする人は、勝つための鍵は“リズム”をプレイすることを知っています。いわゆるリズムは、プレイヤーの各コマンド間の接続方法、一貫性があるかどうかに由来します。AIにおいても、細部で人間の知性を超えることは難しくありませんが、一つ一つのアクションをどのように結びつけ、全体的な価値を最大化するかがAIの発展の鍵となります。

これら4つの方向性の最も素晴らしい部分は、現実の人間の能力に対応していることです。世界を認識し解釈する人間の知性だけでなく、記憶、協調、物理世界に反応する人間の“運動エネルギー”です。

これで、StarCraftが一般知能の鍵と呼ばれる理由が理解できるかもしれません。AIがより混沌とした現実世界の環境で人間の心のように学習する可能性を示しているからです

実験環境から実環境への移行であるだけでなく、長期的には、この種のゲームはAIによって完全に征服され、エージェントからヒューマノイドエージェントへの移行の鍵になるかもしれません。

たとえ壮大な提案がなくても、このようなエージェントは、株式アナリスト、広告プランナー、弁護士をAIが置き換えるような大きなビジネス変革の礎石になるかもしれません。少なくとも、そのようなインテリジェントゲームは、トッププレイヤーとStarCraftをプレイするよりも難しくないかもしれません。

AI企業のStarCraftへの愛は、今のところ非常に理解できます。

投稿者:メアリー