未知のナスカの地上絵をAIで探す、試行錯誤が面白い
少し前に、こんな報道が出ていた。
「ナスカの地上絵」AIが新たに4点特定 航空写真を解析 山形大学などの研究グループ
https://news.tv-asahi.co.jp/news_society/articles/000302096.html
ナスカは広大な砂漠地帯なので、航空写真があったとしても人の目で見てスクリーニングをかけていくのは大変だ。
そこへ画像認識の得意なAIを投入して自動で地上絵を検知させてしまおう、という試みはイマドキ風で面白そうに聞こえる。だが、表向きに報道される内容とは裏腹に、実際の研究は結構たいへんそうである。
というわけで、本件に関する論文を読んでみた。
「AIで新たに4点見つけた!」という報道の裏には、「学習データが少ない」「発見出来ないパターンもある」といった事実があり、この手法はまだ発展途上だということがわかる。
Accelerating the discovery of new Nasca geoglyphs using deep learning
https://www.sciencedirect.com/science/article/pii/S0305440323000559?via%3Dihub
前提として、AI(今回はディープラーニングを使っている)は、事前にデータを学習させないと何も出来ない。
目的に応じた良質な学習データの準備、学習のさせ方、何をどう重み付けするか、といった部分は技術領域となる。単純に大量のデータを突っ込んだだけでは賢くならない。質の悪いデータを大量に突っ込むと、ツイッターで断片的な知識をひけらかすが本質的なことは何も理解していない人みたいなのが出来てしまったり、すでに知っていることに対しては正しく回答できるのにちょっとパターンが変わると応用が効かない丸暗記人間みたいなのが出来てしまったりする。
なので、どういうデータセットを用意して、どう学習させたのか、の部分が非常に重要。
そして、ナスカの地上絵の厄介なところは、大きさも形状もまちまちで、学習させづらいだということだ。
こちらが代表的な地上絵パターンとして論文内で提示されていたもの。これを見ただけでも、地上絵ってずいぶんブレ幅があるんだなと思うはずだ。そう、作られた時代や、作った場所の土壌によってかなり違う。また、大きさも10m未満から300mとまちまちで、統一された「これが地上絵です」という要素を抽出しづらいのだ。
この5つのタイプのうち、有名なのはいちばん左の(A)、「線タイプ」だと思う。
これは地表から黒い石を取り除いて線として下地を露出させた単純なもの。
残る右4つは「浮き彫りタイプ」で、どけた石を絵の部分に積み上げているので盛り上がって見える。
線タイプより古い時代に作られたものと考えられており、タイプ別に4つに分けられている。
(B) 浮き彫りタイプ1
絵に沿って黒い石を取り除き、白い砂を露出させたもの。取り除いた石の一部で細部を表現している。タイプ3と似ていて、こんもりした感じ。
(C)浮き彫りタイプ2
周りの黒い石を取り除いているので、絵の周りが真っ白。
(D)浮き彫りタイプ3
絵の輪郭に沿って黒い石を取り除き、取り除いた石をモチーフの上に積み重ねているため、こんもりした感じになっている。
(E)浮き彫りタイプ4
絵の内側から黒い石をすべて取り除いており、タイプ2と逆に絵の中の部分が真っ白。
これら、それぞれのタイプを学習させなければならないのだが、タイプ別にするとサンプル数が圧倒的に少ない。ディープラーニングはパラメータ数に従って必要となる学習データが決まるのだが、一般的には、数千から数万という数が必要になる。しかし地上絵はそんなに数がない。
傾きや縮尺を変えてデータを水増しする方法もあるが、この論文では、地上絵を「パーツ」ごとに分解して、一つの地上絵から複数のデータを作ることで対応している。
これで学習させて新たに発見したのが4点。
ただし、テストとしてすでに見つかっている地上絵を検知させようとしたところ、2件ほど見逃しもあったという。これは学習データが足りないことに起因すると考えられている。
問題点はいくつかあるが、砂地に描かれたもので、周囲の地形と色合いがあまり違わないものは発見出来ないのだという。また、斜面に描かれているものは、上空からの航空写真だと学習データとして不適切な可能性もあるという。
いずれにしても、AIによる未知の地上絵の発見は、まだ発展途上であり、AIも強化訓練の最中のようだ。検知率が高まれば、さらなる発見も期待できる。
あと、もしこのAIでサンプル数の少ない遺跡を検知させる学習方法がある程度確立されれば、近年になって研究の盛んになってきたサウジアラビアの沙漠の遺跡とか、あまり発掘されてないシベリアの遺跡とか、モンゴル~ロシアあたりのクルガンとかも見つけられるんじゃ? と、夢が広がる。
それらを楽しみにしておきたい。
「ナスカの地上絵」AIが新たに4点特定 航空写真を解析 山形大学などの研究グループ
https://news.tv-asahi.co.jp/news_society/articles/000302096.html
ナスカは広大な砂漠地帯なので、航空写真があったとしても人の目で見てスクリーニングをかけていくのは大変だ。
そこへ画像認識の得意なAIを投入して自動で地上絵を検知させてしまおう、という試みはイマドキ風で面白そうに聞こえる。だが、表向きに報道される内容とは裏腹に、実際の研究は結構たいへんそうである。
というわけで、本件に関する論文を読んでみた。
「AIで新たに4点見つけた!」という報道の裏には、「学習データが少ない」「発見出来ないパターンもある」といった事実があり、この手法はまだ発展途上だということがわかる。
Accelerating the discovery of new Nasca geoglyphs using deep learning
https://www.sciencedirect.com/science/article/pii/S0305440323000559?via%3Dihub
前提として、AI(今回はディープラーニングを使っている)は、事前にデータを学習させないと何も出来ない。
目的に応じた良質な学習データの準備、学習のさせ方、何をどう重み付けするか、といった部分は技術領域となる。単純に大量のデータを突っ込んだだけでは賢くならない。質の悪いデータを大量に突っ込むと、ツイッターで断片的な知識をひけらかすが本質的なことは何も理解していない人みたいなのが出来てしまったり、すでに知っていることに対しては正しく回答できるのにちょっとパターンが変わると応用が効かない丸暗記人間みたいなのが出来てしまったりする。
なので、どういうデータセットを用意して、どう学習させたのか、の部分が非常に重要。
そして、ナスカの地上絵の厄介なところは、大きさも形状もまちまちで、学習させづらいだということだ。
こちらが代表的な地上絵パターンとして論文内で提示されていたもの。これを見ただけでも、地上絵ってずいぶんブレ幅があるんだなと思うはずだ。そう、作られた時代や、作った場所の土壌によってかなり違う。また、大きさも10m未満から300mとまちまちで、統一された「これが地上絵です」という要素を抽出しづらいのだ。
この5つのタイプのうち、有名なのはいちばん左の(A)、「線タイプ」だと思う。
これは地表から黒い石を取り除いて線として下地を露出させた単純なもの。
残る右4つは「浮き彫りタイプ」で、どけた石を絵の部分に積み上げているので盛り上がって見える。
線タイプより古い時代に作られたものと考えられており、タイプ別に4つに分けられている。
(B) 浮き彫りタイプ1
絵に沿って黒い石を取り除き、白い砂を露出させたもの。取り除いた石の一部で細部を表現している。タイプ3と似ていて、こんもりした感じ。
(C)浮き彫りタイプ2
周りの黒い石を取り除いているので、絵の周りが真っ白。
(D)浮き彫りタイプ3
絵の輪郭に沿って黒い石を取り除き、取り除いた石をモチーフの上に積み重ねているため、こんもりした感じになっている。
(E)浮き彫りタイプ4
絵の内側から黒い石をすべて取り除いており、タイプ2と逆に絵の中の部分が真っ白。
これら、それぞれのタイプを学習させなければならないのだが、タイプ別にするとサンプル数が圧倒的に少ない。ディープラーニングはパラメータ数に従って必要となる学習データが決まるのだが、一般的には、数千から数万という数が必要になる。しかし地上絵はそんなに数がない。
傾きや縮尺を変えてデータを水増しする方法もあるが、この論文では、地上絵を「パーツ」ごとに分解して、一つの地上絵から複数のデータを作ることで対応している。
これで学習させて新たに発見したのが4点。
ただし、テストとしてすでに見つかっている地上絵を検知させようとしたところ、2件ほど見逃しもあったという。これは学習データが足りないことに起因すると考えられている。
問題点はいくつかあるが、砂地に描かれたもので、周囲の地形と色合いがあまり違わないものは発見出来ないのだという。また、斜面に描かれているものは、上空からの航空写真だと学習データとして不適切な可能性もあるという。
いずれにしても、AIによる未知の地上絵の発見は、まだ発展途上であり、AIも強化訓練の最中のようだ。検知率が高まれば、さらなる発見も期待できる。
あと、もしこのAIでサンプル数の少ない遺跡を検知させる学習方法がある程度確立されれば、近年になって研究の盛んになってきたサウジアラビアの沙漠の遺跡とか、あまり発掘されてないシベリアの遺跡とか、モンゴル~ロシアあたりのクルガンとかも見つけられるんじゃ? と、夢が広がる。
それらを楽しみにしておきたい。