4,000体を超える四足歩行ロボットの大群が行進していたとしたら、それがたとえシミュレーションだったとしても空恐ろしい光景だろう。だが、このシミュレーションはロボットが新しい技能を習得する道しるべとなるかもしれない。
この仮想ロボット部隊は、スイス連邦工科大学チューリッヒ校(ETHチューリッヒ)とチップメーカーのエヌヴィディア(NVIDIA)の研究者たちによって開発された。研究者たちは歩き回る仮想ロボットを使ってアルゴリズムを訓練し、そのアルゴリズムによって現実世界のロボットの足を制御した。
「ANYmal」と呼ばれるこのロボットは、シミュレーションで仮想環境のスロープや段差、急な坂といった障壁に立ち向かう。課題をどのように切り抜けるのかをロボットが学習するたびに、研究者たちはより厳しい課題を提示して制御アルゴリズムをさらに洗練していった。
このシミュレーションは遠目に見ると、まるでアリの部隊が広い場所をうごめいているように思える。ロボットは訓練中、階段の昇り降りは容易にマスターできたが、複雑な障害には多くの時間がかかった。斜面がとりわけ難しかったが、一部のロボットは斜面を滑り降りることができるようになった。
研究者たちは仮想環境で訓練したアルゴリズムを、現実世界のANYmalに適用した。実物のANYmalは大型犬くらいの大きさの四足歩行ロボットで、頭部と取り外し可能なロボットアームにセンサーが付いている。
適用の結果、ANYmalは階段やブロックの上をうまく進むことができたものの、動きを速くすると問題が生じた。研究者たちは、これが現実世界のセンサーの計測精度がシミュレーションに比べて劣っていることが原因だと考えた。
訓練時間が100分の1以下に
このようにロボットに学習させることは、物流施設での荷分けや、衣服の縫製から作物の収穫に至るまで、ロボットがさまざまな作業を学習する上で役立つ可能性がある。また、人工知能(AI)の応用を今後進めていく上で、シミュレーションと特別なコンピューターチップが重要であることも示唆している。
「基本的にシミュレーションを高速に実行できるのは、とても素晴らしいことです」と、カリフォルニア大学バークレー校の教授でAIとシミュレーションで物流企業向けの自動仕分けロボットを訓練するCovariantの共同創業者のピーター・アビールは語る。アビールはETHチューリッヒとエヌヴィディアの研究者たちについて、「素晴らしい高速化を実現しました」と語る。
現実世界のタスクには、ソフトウェアに簡単に書き起こせなかったり、何らかの適応を必要としたりするものがある。そしてAIは、ロボットを訓練してそのようなタスクを実行させられることを期待されている。例えば、扱いづらい物体や滑る物体、未知の物体を掴む能力は、コードに書き起こせるものではない。
シミュレーションを実施した4,000体のロボットは、強化学習によって訓練された。強化学習とは、動物が正負のフィードバックを受けて学習する方法の研究から着想を得たAIの手法である。ロボットが足を動かすと、アルゴリズムはロボットが歩く能力にその動きがどのような影響を与えたのかを判定し、それに応じて制御アルゴリズムを調整する。
このシミュレーションは、コンピューターやサーヴァーで使われる一般的な用途のチップではなく、エヌヴィディアのAI専用チップで実施された。その結果、研究者たちによると、通常の100分の1以下の時間でロボットを訓練できたという。
ロボットの知能を向上させる可能性
特別なチップを使うことで課題も生じた。エヌヴィディアのチップは、グラフィックのレンダリングとニューラルネットワークの実行に不可欠な計算能力は高いが、昇り降りといった物理的特性のシミュレーションにはあまり適していなかったのだ。
そこで研究者たちは、ソフトウェアによる巧妙な対応策を考えなければならなかった。エヌヴィディアのシミュレーション技術担当ヴァイスプレジデントのレヴ・レバレディアンは、「うまくやり遂げる方法を思いつくまでには長い時間かかりました」と語る。
シミュレーション、AI、そして特別なチップは、ロボットの知能を向上させる可能性を秘めている。エヌヴィディアは、同社製のチップで産業用ロボットのシミュレーションと制御をより簡単にするソフトウェアツールを開発した。また2019年には、シアトルにロボット研究所を開設したほか、自律走行車用のチップとソフトウェアも販売している。
3D環境の構築用ソフトウェアを開発しているUnity Technologiesも、ロボット工学者に適したソフトウェアの開発に参入した。同社のAI担当ヴァイスプレジデントのダニー・ランジは、多くの研究者が同社のソフトウェアでシミュレーションを実行していることに気づいたことで、ソフトウェアをさらに現実に即したものに改良し、ほかのロボット工学用ソフトウェアとの互換性も高めたと語る。同社は現在、丸太を運ぶ林業用ロボットを強化学習とシミュレーションで訓練できるかテストしているスウェーデン企業のAlgoryxと提携している。
強化学習の威力を加速
強化学習は数十年前から存在しているが、ほかの技術の進歩のおかげでAI分野に特筆すべきマイルストーンを打ち立てている。2015年には、難解かつ直感的なボードゲームである囲碁を打つAIを訓練するために使われ、人間を超える性能を達成した。
もっと最近では、経験と判断が必要なチップの設計を自動化するなど、実用的な用途にも使われている。だが厄介なことに、この学習方法には膨大な時間とデータが必要だ。
AIの研究を手がけているOpenAIは、手の形をしたロボットでルービックキューブを解くために強化学習を用いて訓練した際、多数のCPUを併用したが、ロボットが大まかにルービックキューブを扱えるようになるまでに2週間以上かかった。ロボットを再び訓練するために毎回2週間も待たなければならないとなると、企業はそのロボットの使用を思いとどまるかもしれない。
強化学習でロボットを訓練する初期の取り組みでは、複数の現実世界のロボットを併用することで学習を実行していた。しかし物理シミュレーションが進歩したことで、多数の仮想ロボットを利用すれば学習をずっと早く進められるようになったのである。
マサチューセッツ工科大学(MIT)の学生で、同様のシミュレーション手法でロボットの新しい物理設計を考案しているアンドリュー・スピルバーグは、この新しいロボットについて「エンドユーザーにとって非常に心が躍ります」と語る。スピルバーグは関連する研究として、グーグルの研究グループが同社の機械学習用チップ「Tensor Processing Unit(TPU)」上で物理シミュレーションと強化学習を実行することでロボットの学習を高速化していると指摘する。
非営利団体「Open Robotics」で、広く使われているオープンソースのロボット用OS「ROS(Robot Operating System)」を管理するタリー・フットは、商用ユーザー向けにシミュレーションの重要性が高まっていると語る。「ハードウェアに適用する前に現実的なシナリオでソフトウェアを検証することは、非常に多くの時間とお金の節約になります」と、フットは言う。「現実世界よりも高速に実行でき、決してロボットを壊してしまうことはなく、エラーがあれば自動的かつ即時にリセットできますから」
しかしフットは、ロボットの学習内容を現実世界に移すことはさらに難しいと付け加える。「現実世界にはさらに多くの不確実性があります」と、フットは語る。「汚れ、照明、天気、ハードウェアの個体差、摩耗など、すべてが考慮されなければなりません」
エヌヴィディアのレバレディアンは、歩行ロボットの訓練に使われるようなシミュレーションは最終的に、訓練に使われるアルゴリズムの設計にも影響を及ぼす可能性があると語る。「仮想世界はあらゆることに利用できます。しかし確実に、最も重要な価値のひとつは、つくりたいAIを動かしてみたり、訓練したりする場所を組み立てられることなのです」
※『WIRED』による人工知能(AI)の関連記事はこちら。ロボットの関連記事はこちら。
からの記事と詳細 ( 歩行するロボットの進化を、仮想環境でのシミュレーションが加速する - WIRED.jp )
https://ift.tt/3G3CCLj
0 Comments:
Post a Comment