2021/08/20 情報福祉マネジメント学科

教員の声:人工知能はどこを見ているの?

教員の声<不定期更新>
学科の教育や活動について学科教員の視点でまとめて報告します。第13回目となる今回は岩田先生による人工知能についての話です。

こんにちは。岩田です。

今回は「人工知能はどこを見ているの?」ということで、近年、人工知能と呼ばれているプログラムは画像のどの部分から『判断』を行っているかを紹介します。

その前に、最近、人工知能と呼ばれるものは大きく分けて、猫か犬かなどカテゴリーを『判断』するもの、明日の気温など数値を『予測』するもの、そして、ボードゲームなどで次の行動を『探す』ものの3つがあります。これら3つはそれぞれの間に関係性がありますが、今回は、カテゴリーの『判断』に該当するものについてお話します。

では、先ず、カテゴリーの『判断』とは何かについてお話します。

といっても、やりたいこと自体は難しいことではなく、画像に写っているものが何かをプログラムに『判断』させるというのもです。具体的には、下図のような画像が与えられた時に、それに写っているのが、ハチか、犬か、キツネか、などをプログラム(コンピュータ)に自動で判断させるものです。
『判断』させる画像例
『判断』させる画像例
写真を見て、それに写っているものが何かを判断するなんてことは、写っているものを知っている人がやるならなんてことはない作業で、左上はハチですし、その一つ右は猫ですし、ハチの下はシャチです。

ところが、例えば、犬を知らない子どもに『犬とは何か』を教えるのって、難しくないですか?

「耳があって、足が4本あって、目は…」では、それは猫とどこが違うのか、また、耳とは何で、足とは何で、を説明(定義)しなければいけないかもしれません。人工知能を作るというのは、この作業に似ています。

つまり、最初は何も知らない子どものようなコンピュータに、犬とは何か、猫とは何か、を教えるということです。

そして、その方法の1つは「耳が2つある」かつ「足が4本ある」かつ「大きさは50cmくらい」であれば“猫”の様に人の知識・経験をコンピュータにプログラムするものです。この「人の知識・経験」を専門用語ではヒューリスティック(heuristics)といいます。この手法は人工知能を作るに当たって、データが不足している際に有力な方法とされています。

ただ、現在、画像に写っているもの判断ではこの手法は主流でなく、「この写真に写っているのは猫」、とか、「この写真に写っているのは犬」みたいに写真とそれに写っているものの組をコンピュータに与えて、コンピュータ自身に写っているものは何かを“学習”させる手法が主流です。この手法は扱えるデータ量の爆発的な増加や、コンピュータの計算能力の向上、アルゴリズム群の洗練化を背景に大成功を収めています。このコンピュータの行う学習のことを「機械学習」と呼びます。今日、人工知能と呼ばれるもの多くはこの「機械学習」によってえられるものを指しているように思います。

正確に分類ができていれば、コンピュータが写真の中の何を“見て”判断しているかは気にしない、という考え方もあると思いますが、中には、コンピュータがどこを“見て”るのか気になる方もいると思います。人と同じような部分から判断しているのかもしれませんし、コンピュータ独自の観点があるかもしれません。そこで、今回は少し古いアルゴリズムですが、Grad-Cam(https://arxiv.org/abs/1610.02391)と呼ばれる手法でコンピュータの見ている部分を可視化してみました。
Grad-Camの処理を実施した結果
Grad-Camの処理を実施した結果
上の図は最初の図の写真をコンピュータに判断させた際、コンピュータが該当する動物名を決める時に重視している箇所をGrad-Camアルゴリズムによって明るく表示したものです。

例えば、カブトムシと判断する際は2本の角を重視していて、キツネと判断する際には2つの耳を重視しているということになります。全体的には頭や顔の部分を重視して決めている様子が見て取れますが、ハチやカブトムシなど昆虫については足や角などに重きを置いているようです。

図から、思いの外、人が判断する際に注目している部分と似た所から判断しているようですね。ただ、上で述べたとおり、これらはコンピュータが自身の学習の結果として見出した判断基準であって、人が教えたわけではない点に注意が必要です。

つまり、この分類については、人の学習結果とコンピュータの学習結果は似た結論になっているということです。詳しいことを述べることはしませんが、人の学習と機械学習の間には共通点も多いものの、相違点も結構あり、そのような違いがあるにも関わらず、同じような注目点に到達するのは面白いですね。

それでは、また。

関連ページ

この記事に関するお問い合わせ

教務部教務課
住所:〒981-8522 宮城県仙台市青葉区国見1−8−1
TEL:022-717-3315
FAX:022-301-1280
E-Mail:kyomu@tfu-mail.tfu.ac.jp