ロボットに教えるのが最も難しい 10 のこと

ねえ、ロボットはキャッチボールをすることができます。ドイツの航空宇宙機関であるドイツ航空宇宙局が開発した人型双腕システムであるロボット ジャスティンは、ボールをキャッチしたり、コーヒーを提供したりするなど、与えられたタスクを自律的に実行できます。 ロボットの写真を もっと見る 。 ©マイケル・ダルダー/ロイター/コービス

人間であることは、人間を作り上げることよりもはるかに簡単です。

前庭で友達とキャッチボールをするなどの単純なことを考えてみましょう。この活動を、それを達成するために必要な個別の生物学的機能に分解すると、それは決して単純ではありません。センサー、送信機、エフェクターが必要です。あなたとあなたの仲間との間の距離に基づいて、投げる強さを計算する必要があります。太陽のまぶしさ、風速、周囲の気を散らすものを考慮する必要があります。ボールをどのくらいしっかりと握るか、キャッチボール中にミットを握るタイミングを決定する必要があります。そして、ボールが私の頭上を越えたらどうなるかなど、さまざまな仮定のシナリオを処理できる必要があります。それが道路に転がり落ちたらどうなるでしょうか?隣の家の窓に衝突したらどうなるでしょうか?

これらの質問は、ロボット工学の最も差し迫った課題のいくつかを示しており、カウントダウンの準備を整えます。私たちは、ロボットに教えるのに最も難しいこと 10 個のリストを、大まかに「最も簡単」から「最も難しい」まで順番にまとめました。ディック・ブラッドベリの約束を実現するためには、この 10 個を克服する必要があります。 、アシモフ、クラーク、そして機械が人間のように振る舞う世界を想像した他のストーリーテラー全員。

10: 道を切り開く

 10: 道を切り開く

地点 A から地点 B に移動するのはとても簡単に思えます。私たち人間はそれを一日中、毎日行っています。しかし、ロボットにとって、ナビゲーション、特に常に変化する単一の環境、またはこれまでに遭遇したことのない環境間でのナビゲーションは、難しい作業となる可能性があります。まず、ロボットはその環境を認識できなければならず、次に受信データを理解できなければなりません。

ロボット工学者は、周囲を評価するために一連のセンサー、スキャナー、カメラ、その他のハイテク ツールを機械に装備することで、最初の問題に対処します。レーザー スキャナーはますます人気が高まっていますが、水は光を妨げ、センサーの範囲を大幅に狭める傾向があるため、水中環境では使用できません。ソナー技術は水中ロボットでは実行可能なオプションですが、陸上のアプリケーションでは精度がはるかに低くなります。そしてもちろん、統合された立体カメラのセットで構成されるビジョン システムは、ロボットがその風景を「見る」のに役立ちます。

環境に関するデータを収集することは、戦いの半分に過ぎません。より大きな課題には、そのデータを処理し、それを使用して意思決定を行うことが含まれます。多くの研究者は、事前に指定された地図を使用したり、その場で地図を構築したりしてロボットをナビゲートさせています。ロボット工学では、これはSLAM (位置特定とマッピングの同時実行)として知られています。マッピングは、ロボットがセンサーで収集した情報を特定の表現に変換する方法を記述します。ローカリゼーションは、ロボットが地図に対してどのように位置決めするかを表します。実際には、これら 2 つのプロセスは同時に発生する必要があり、鶏が先か卵が先かという難題が生じますが、研究者はより強力なコンピューターと、確率に基づいて位置を計算する高度なアルゴリズムを使用して、この難題を克服することができました。

9: 器用さを発揮する

 9: 器用さを発揮する

ロボットは何年もの間、工場や倉庫で荷物や部品を拾ってきました。しかし、彼らは通常、このような状況では人間を避け、ほとんどの場合、整然とした環境で一貫した形状の物体を扱います。工場の現場を超えて冒険するロボットにとって、人生ははるかに構造化されていません。もしそのような機械が家庭や病院で稼働することを望むなら、近くにいる人を検知し、乱雑に集められた物のなかから一つの物を選び出すことができる高度な触覚が必要となるだろう。

これらはロボットが習得するのが難しいスキルです。従来、科学者は接触を完全に避け、別の物体と接触すると機械が故障するようにプログラムしていました。しかし、ここ 5 年ほどで、準拠したデザインと人工皮膚は大幅に進歩しました。コンプライアンスとは、ロボットの柔軟性のレベルを指します。柔軟性の高いマシンは準拠性が高くなります。堅固な機械はそうではありません。

2013 年、ジョージア工科大学の研究者は、関節にバネを備えたロボット アームを構築しました。これにより、人間の腕のように付属肢を曲げて環境と相互作用できるようになります。次に、圧力や接触を感知できる「皮膚」で全体を覆いました。一部のロボットのスキンには、連動する六角形の回路基板が含まれており、各基板には 1 センチメートル以内に近づくものを検知できる赤外線センサーが搭載されています。他の製品には、電子「指紋」、つまりグリップを向上させ、信号処理を容易にする隆起した表面が装備されています。

これらのハイテク アームと改良されたビジョン システムを組み合わせると、優しい愛撫をしたり、キャビネットに手を伸ばして膨大なコレクションから 1 つのアイテムを選択したりできるロボットが得られます。

8: 会話をする

 8: 会話をする

コンピューター サイエンスの創始者の 1 人であるアラン M. チューリングは、1950 年に大胆な予測を立てました。「機械はいつか、非常に流暢に話すことができるようになり、人間と機械の区別がつかなくなるようになるだろう」というものです。残念ながら、ロボット ( Siriでさえも) はまだチューリングの期待に応えていません。それは、音声認識が自然言語処理、つまり会話中に単語や文章から意味を抽出するために脳が行う処理とは大きく異なるためです。

当初、科学者たちは、文法規則をマシンのメモリバンクに組み込むだけで簡単にできるだろうと考えていました。しかし、特定の言語の文法入門書をハードコーディングすることは不可能であることが判明しました。個々の単語の意味に関するルールを設けるだけでも、言語学習は困難な作業になっています。例が必要ですか? 「新しい」と「知っていた」、あるいは「銀行」(お金を置く場所)と「銀行」(川の岸辺)を考えてみましょう。人間は、長年の進化の中で発達した精神的能力に依存して、これらの言語的特異性を理解していることが判明しましたが、科学者はこれらの能力を個別の識別可能なルールに分解することができていません。

その結果、今日の多くのロボットは統計に基づいて言語処理を行っています。科学者は、コーパスとして知られる膨大なテキストのコレクションを彼らに与え、コンピューターに長いテキストをいくつかのチャンクに分解させて、どの単語がどのような順序で頻繁に組み合わされるかを調べます。これにより、ロボットは統計分析に基づいて言語を「学習」できます。たとえば、ロボットにとって、「フライ」または「翼」という単語を伴う「バット」という単語は飛行する哺乳類を指しますが、「バット」の後に「ボール」または「グローブ」が続くとチーム スポーツを指します。

7: 新しいスキルを習得する

 7: 新しいスキルを習得する

ゴルフをしたことがない人がクラブの振り方を学びたいとします。それについての本を読んで試してみることもできるし、練習を積んだゴルファーが適切な動作を行うのを観察することもでき、新しい動作をより早く簡単に習得することができました。

ロボット工学者は、新しいスキルを学習できる自律型機械を構築しようとするときに、同様のジレンマに直面します。ゴルフの例と同様、1 つのアプローチは、アクティビティを正確なステップに分解し、その情報をロボットの脳にプログラムすることです。これは、アクティビティのあらゆる側面を分析、記述、コード化できることを前提としていますが、実際には、これは必ずしも簡単なことではありません。たとえば、ゴルフクラブのスイングには、手首と肘の相互作用など、おそらく説明できない特定の側面があります。こうした微妙な詳細は、話すよりも見せることではるかに簡単に伝達できます。

近年、研究者らはロボットに人間のオペレーターを模倣するよう教えることである程度の成功を収めている。彼らはこれを模倣学習またはデモンストレーションからの学習( LfD ) と呼び、マシンに広角カメラやズーム カメラを多数装備することでこれを成功させます。この装置を使用すると、ロボットは人間の教師が特定のプロセスやアクティビティを実行しているのを「見る」ことができます。次に、学習アルゴリズムがこのデータを処理して、視覚的な入力を目的のアクションに結び付ける数学的関数マップを生成します。もちろん、LfD シナリオのロボットは、教師の行動の特定の側面 (かゆいところを掻くなど) を無視し、ロボットの解剖学的構造が人間とは異なる点を指す対応問題に対処できなければなりません。

6: 欺瞞を実践する

 6: 欺瞞を実践する

巧妙な欺瞞の技術は、動物が競争相手に有利に働き、捕食者に食べられるのを避けるために進化してきました。練習すれば、このスキルは非常に効果的な生存メカニズムになります。

ロボットにとって、人や他のロボットをだます方法を学ぶのは困難でした(そしてあなたにとってはそれでいいかもしれません)。欺瞞には想像力、つまり感覚には存在しない外部の物体のアイデアやイメージを形成する能力が必要ですが、これは通常、機械には欠けているものです(リストの次の項目を参照)。彼らはセンサー、カメラ、スキャナーからの直接入力の処理には優れていますが、感覚データすべてを超えて存在する概念を形成することにはあまり優れていません。

ただし、将来のロボットは策略に精通しているかもしれません。ジョージア工科大学の研究者らは、リスの欺瞞的なスキルの一部を研究室のロボットに応用することに成功した。まず、彼らは、競争相手を古くて使われていない隠し場所に誘導することで、埋められた食料の隠し場所を守る、毛羽立ったげっ歯類を研究した。次に、それらの行動を単純なルールにコード化し、ロボットの脳にロードしました。機械はアルゴリズムを使用して、特定の状況で欺瞞が役立つかどうかを判断できました。もしそうであれば、彼らはコンパニオンボットを隠れ場所から遠ざける偽の通信を提供することができました。

5: 人間の行動を予測する

 5: 人間の行動を予測する

「ジェットソンズ」では、メイドロボットのロージーが会話をしたり、食事を作ったり、家の掃除をしたり、ジョージ、ジェーン、ジュディ、エルロイのニーズや要望に応えることができました。ロージーの高度な発達を理解するために、シーズン 1 の最初のエピソードのこのシーンを考えてみましょう。ジョージの上司であるスペースリー氏が夕食のためにジェットソンの家にやって来ます。食事の後、スペースリー氏が葉巻を取り出して口に入れると、ロージーさんがライターを持って駆け寄る。この単純な行動は、人間の複雑な行動、つまり今起こったことに基づいて次に何が起こるかを予測する能力を表しています。

欺瞞と同様に、人間の行動を予測するには、ロボットが将来の状態を想像する必要があります。 「ある人間が x をしているのを観察した場合、これまでの経験に基づいて、彼女はおそらく y をフォローアップするであろうことが期待できます。」と言えなければなりません。これはロボット工学においては深刻な課題でしたが、人間は進歩しています。コーネル大学のチームは、コンパニオンが環境内の物体とどのように相互作用するかに基づいて反応できる自律型ロボットの開発に取り組んでいます。これを達成するために、ロボットは 1 対の 3D カメラを使用して周囲の画像を取得します。次に、アルゴリズムが部屋内の重要なオブジェクトを特定し、それらを背景の雑然としたものから分離します。次に、ロボットは、以前のトレーニング セッションから収集した豊富な情報を使用して、人間とその人間が触れた物体の動きに基づいて、予想される一連の予測を生成します。ロボットは次に何が起こるかを最善の推測をし、それに応じて行動します。

コーネル大学のロボットは依然として時々推測を間違えることがありますが、特にカメラ技術が向上するにつれ、着実に進歩しています。

4: 別のロボットとアクティビティを調整する

単一の大規模マシン (いわばアンドロイド) を構築するには、多大な時間、エネルギー、資金の投資が必要です。別のアプローチには、より複雑なタスクを達成するために連携して動作する、より小型で単純なロボットの軍隊を配備することが含まれます。

これにより、別の一連の課題が生じます。チーム内で作業するロボットは、チームメイトとの関係で自身を正確に位置決めできなければならず、他のマシンや人間のオペレーターと効果的に通信できなければなりません。これらの問題を解決するために、科学者たちは昆虫の世界に目を向けました。昆虫は、食物を見つけてコロニー全体に利益をもたらす任務を遂行するために複雑な群がる行動を示します。たとえば、研究者はアリを研究することによって、個体がフェロモンを使用して相互にコミュニケーションしていることを知っています。

ロボットもこれと同じ「フェロモン ロジック」を使用できますが、通信には化学物質ではなく光に依存しています。それは次のように機能します。小さなボットのグループが限られたエリアに分散されます。最初は、ある人物が別のボットが残した光の痕跡に遭遇するまで、エリアをランダムに探索します。それは道跡をたどることを知っており、それを実行し、進むにつれて自分自身の光の跡を残します。道が強化されると、ますます多くのボットがそれを見つけてワゴン列車に加わります。一部の研究者は、可聴チャープを使用して成功を収めています。サウンドは、個々のボットが遠くを歩き回らないようにしたり、チームメイトを興味のあるアイテムに引き付けたりするために使用できます。

3: それ自体のコピーを作成する

 3: それ自体のコピーを作成する

神はアダムとイブに、「産めよ、増えよ、地に満ちよ」と言われました。同じコマンドを受け取ったロボットは、あわてたりイライラしたりするでしょう。なぜ?なぜなら、自己複製はとらえどころのないことが証明されているからです。ロボットを構築することと、それ自体のコピーを作成したり、失われたり損傷したコンポーネントを再生したりできるロボットを構築することはまったく別のことです。

興味深いことに、ロボットは人間を生殖のロールモデルとして見ていない可能性があります。おそらく、実際には 2 つの同一の部分に分割されていないことに気づいたでしょう。しかし、単純な動物は常にこれを行います。ヒドラとして知られるクラゲの親戚は、出芽として知られる無性生殖の一種を実践します。小さな嚢が親の体から外側に膨らみ、その後壊れて、新しい遺伝的に同一の個体になります。

科学者たちは、この基本的なクローン作成手順を実行できるロボットの開発に取り組んでいます。これらのロボットの多くは、同一の機械と自己複製のためのプログラムを含む繰り返し要素 (通常は立方体) から構築されています。キューブの表面には磁石が付いているので、近くにある他のキューブに取り付けたり取り外したりすることができます。各立方体は対角線に沿って 2 つの部分に分割されているため、各半分は独立して回転できます。したがって、完全なロボットは、特定の構成で配置されたいくつかの立方体で構成されます。キューブの供給が利用可能である限り、1 台のロボットがかがみ、その「本体」からキューブを取り外して新しいマシンをシードし、完全に形成された 2 台のロボットが並んで立つまで、隠し場所からビルディング ブロックを拾うことができます。

2:倫理原則に基づいて行動する

 2:倫理原則に基づいて行動する

私たちは一日中人々と交流する中で、何百もの意思決定を行っています。それぞれにおいて、私たちは自分の選択を、何が正しくて何が間違っているか、何が公平で何が不公平なのかを比較検討します。ロボットに私たちと同じように行動してもらいたいなら、ロボットには倫理の理解が必要です。

言語と同様に、倫理的行動をコーディングすることも大きな課題です。その主な理由は、広く受け入れられている一連の倫理原則が存在しないためです。文化が異なれば、行動規則も法体系も異なります。同じ文化の中でも、地域の違いは、人々が自分の行動や周囲の人々の行動を評価および測定する方法に影響を与える可能性があります。ロボットが学習ツールとして使用できる、世界的に関連性のある倫理マニュアルを書こうとすることは事実上不可能です。

そうは言っても、研究者たちは最近、問題の範囲を限定することで倫理的なロボットを構築できるようになりました。たとえば、特定の環境 (たとえば、キッチンや介護施設の病室) に限定されたマシンであれば、学習するルールがはるかに少なく、倫理的に健全な意思決定を行うことにある程度の成功を収めることができます。これを達成するために、ロボットエンジニアは、選択されたケースにおいて倫理的であると考えられる選択に関する情報を機械学習アルゴリズムに入力します。選択は、アクションがどの程度良い結果をもたらすか、どの程度の害を防ぐか、そして公平性の尺度という 3 つのスライディング スケールの基準に基づいて行われます。次に、アルゴリズムは、ロボットが意思決定を行う際に使用できる倫理原則を出力します。このタイプの人工知能を使用すると、将来の家庭用ロボットは、家族の誰が皿洗いをするべきか、そして誰がその晩テレビのリモコンを制御できるかを決定できるようになります。

1: 感情を感じる

 1: 感情を感じる

「世界で最も優れたもの、最も美しいものは、見ることも触れることもできません。心で感じなければなりません。」ヘレン・ケラーのこの観察が真実であれば、ロボットは最高のものや美しいものを見逃す運命にあることになります。結局のところ、彼らは周囲の世界を感じることには優れていますが、その感覚データを特定の感情に変えることはできません。彼らは、愛する人の笑顔を見て喜びを感じることも、影のある見知らぬ人の顔をしかめて恐怖に震えるのを記録することもできません。

これは、私たちのリストにある何よりも、人間と機械を分けるものである可能性があります。ロボットに恋を教えるにはどうすればよいでしょうか?イライラ、嫌悪感、驚き、哀れみなどをどうやってプログラムできるのでしょうか?試してみる価値はありますか?

そう考える科学者もいます。彼らは、将来のロボットは両方の認知感情システムを統合し、その結果、より良く機能し、より速く学習し、人間とより効果的に対話できるようになると信じています。信じられないかもしれませんが、人間の限られた範囲の感情を表現するプロトタイプはすでに存在しています。ヨーロッパの研究チームが開発したロボット「ナオ」は、1歳児の感性を持っています。ポーズとジェスチャーを組み合わせることで、幸福、怒り、恐怖、誇りを表現できます。これらの表示動作は、チンパンジーと人間の幼児の研究から得られたもので、Nao にプログラムされていますが、ロボットは、近くの人や物体との相互作用に基づいて、どの感情を表示するかを決定します。今後数年間で、ナオのようなロボットは、病院、家庭、学校などさまざまな環境で働き、助けの手を差し伸べたり、共感を持って耳を傾けたりすることができるようになるだろう。

著者メモ: ロボットに教えるのが最も難しい 10 のこと

この記事を書きながら、「ロスト・イン・スペース」(1998年の恐ろしい映画ではなく、1960年代のテレビシリーズ)のロボットが私の想像力を駆け巡りました。人間が機械と対話することについて書き、ロボットの象徴的な警告「危険、ウィル・ロビンソン、危険!」を聞かないことは困難でした。 — 私の考えの中で反響します。