運動も習熟「子どものAI」、産業応用で日本にチャンス
AI&IoTビジネス最前線(3) 松尾豊 東京大学大学院工学系研究科
ディープラーニング(深層学習)で画像や音声の認識性能が格段に向上し、コンピューターの「眼の誕生」につながった。従来のコンピューターが苦手としてきた「1歳児レベルの知覚と運動のスキル」を身に付けられるようになった。「子どものAI(人工知能)」はものづくりと相性が良く、日本に勝つチャンスがある。今後、医療などで顕著な進展が予想される。
AIは、様々な技術や製品で使われている。少し整理してみると、大きく4つのレベルに分けられると著者は考えている(図1)。
現在、中心的な役割を果たしているのが、「レベル4」の深層学習だ。深層学習によって画像認識や音声認識の性能が格段に向上。画像認識では2015年、標準的なデータセットで人間の認識精度を上回るところまできた。2016年には、人間の認識精度を大きく超えた。
1980年代から知られる「モラベックのパラドックス(逆説)」という理論がある。大人ができることよりも子どもができることの方が、コンピューターで実現するのは難しいというもの。知能テストやゲームより1歳児レベルで身に付ける知覚と運動スキルの習得の方がはるかに難しい。多くの研究者がこう指摘してきた。
運動の習熟もできるように
ところが、その状況が変わってきた。画像認識で人間を上回り、強化学習という学習技術と組み合わせて運動の習熟もできるようになってきた(図2)。米カリフォルニア大学バークレー校は、深層学習と強化学習を組み合わせて、ロボットの動作が熟練していくデモを公開。例えば、おもちゃの部品を組み立てるなどの動作が、試行錯誤によって徐々に上達する。
こうした一連の技術は認識から運動の習熟へ、そして言語の意味理解へという技術的進展を遂げ、大きな産業的インパクトをもたらす。子どもができることがAIにもできるようになってきたという意味で「子どものAI」と呼ぶ。
一方、「レベル3」やそれ以下の技術をベースとする実用化の流れもある。ビッグデータ、あるいはIoT(モノのインターネット)などのトレンドを背景に、様々なデータが取得され、活用されるようになってきており、以前からあるAIの技術(機械学習や自然言語処理など)を使って画期的なサービスを生み出せるのだ。製造業や農業のスマート化などもこうした流れの1つだ。これらを「大人のAI」と呼ぶ。
コンピューターにおける眼の誕生
大人のAIはビッグデータの世界であり、最初に基盤を築いたものが有利だ。米グーグルなどの企業が強い。経営とどう結びつけるかがカギで、マーケティング、販売と相性が良い。「つながることによる価値」が価値創出の源泉で、多様な価値観のユーザーが多数いる英語圏が有利である。特に米国が強く、日本が逆転するのは難しい。
子どものAIは、「認識ができるようになる」点が価値創出の源泉だ。最近では、コンピューターにおける「眼の誕生」と言われている。網膜がイメージセンサーで、視覚野が深層学習だ。
深層学習は、ものづくりと相性が良い。少子高齢化が進む日本では、肉体労働に関わる労働が不足しているが、これを子どものAIで代替できる。
医療分野で大きく進展
今後は、医療や教育、金融などで顕著な進展が予想される。医療は、子どものAIによって大きく進展する。一般の医療診断支援は大人のAIだが、医療画像診断は子どものAIになる。医療画像では、X線やCT(コンピューター断層撮影装置)、眼底、病理などの診断で飛躍的に進んでいる。
(東京大学大学院工学系研究科 技術経営戦略学専攻 特任准教授 松尾豊)
[書籍『人工知能&IoTビジネス実践編』の記事を再構成]