第3回AI美芸研を傍観してニューラルネットの層とメタレベルの問題

2016年10月18日

ゆらぎを許容する論理性

僕が20年ほど前にニューラルネットを研究していた時のこと。
当時のぼくは建築を専攻していたのでそこでニューラルネットの研究をするというのもおかしなことだが、実際に当時の建築の分野でニューラルネットの研究をしている者は、僕の知る限り僕だけだった。

建築学科でニューラルネットを研究することにどういう意味があるのか?ということであるが、僕がやりたかったことは、建築の分野で当たり前のように考えられていて、建築学科の学生の基本として普通に教えられている「形態理論」というものが、実は論理的なものではなく、非常に直感に頼ったものなのではないか?という直感に基づく仮説についての考察だった。

そして「ニューラルネットは手書き文字を認識することができる」ということに注目した僕は、それを形態理論の認識に応用できないだろうか?ということを考えたわけだ。

このとき重要なことは、当時「形態理論」と呼ばれていたものが本当に論理的なものであるのであれば、コンピュータでそれを判定することは難しいものであるとは思わなかったが、そこに「あいまいさ」が加わると、普通のコンピューターのアルゴリズムではそれを判断することができなくなってしまう、ということだ。
 

たとえば一番わかりやすい例として、シンメトリーをあげてみる。
bongard1
上図で左のグループはシンメトリー(左右対称)、右側のグループはアシンメトリー(左右非対称)の形である。
これらをコンピューターに判断させることは簡単なアルゴリズムで可能だ。
ここで「判断する」という意味は、コンピューターにあるひとつの図像を与えて、それがシンメトリーなのかどうか、という答えを出力させる、という意味だ。

コンピューターで画像を扱う際には「ピクセル」という粒が最小単位になる。たとえば「400x400ピクセル」と言う時には、縦400ピクセル、横400ピクセルの計160000ピクセルからなる画像であるということだ。

与えられた画像がシンメトリーであるのかどうかを判断するプログラムの、一番簡単なアルゴリズムは以下のようになる。
与えられた図像の中心線を求め、それを中心に左右のピクセルについて、ひとつずつ一致するかどうかを調べていく。 
左右のピクセルがひとつでも一致しない場合はアシンメトリー。すべての左右のピクセルが一致すればシンメトリー。

これは非常に簡単なアルゴリズムである。

ただし、人間はこのようには判断していない。
実際には下図のように、論理性に「ゆらぎ」が含まれたものであっても、ある程度は許容誤差としてそれをなかったことにする、ということを人間はやっている。
bongard2
この左側のグループは、一見シンメトリーであるかのように見えながら、それぞれ少しずつ「ずれ」が含まれている。
もちろんその「ずれ」の程度によるのだが、人間はこのようなものであっても「シンメトリーである」と認識することができる。

上図の例は極端にずれがあるので微妙ではあるが、実世界で考えれば、たとえば「シンメトリーである」とされている建築物であっても、その細部を細かく、場合によっては顕微鏡レベルまで観察すれば、かならず左右で異なっているところが出てくるはずである。

僕が研究したかったことは、その「ずれ」をも許容する「形態理論」を「論理的である」と認識する人間の謎で、ようするに人間が「論理的である」と思っているものは、実際にはこの世界には実体としては存在しない、つまり「論理」というものが形而上のものである、ということだった。

そして、書く人によってゆらぎを含む手書き文字をも認識すると言われていたニューラルネットを用いれば、このことをシミュレートすることができるのでは、という直感に基づく研究だった。
 

OLランキングで1位になりたい!賛同していただける方は下記をクリック!
にほんブログ村 OL日記ブログ ドジOLへ

コメントする

名前
 
  絵文字
 
 
第3回AI美芸研を傍観してニューラルネットの層とメタレベルの問題