丸い物体の上に紙を置き、その上にある絵、地図、タトゥーなどを写そうとした人はいるだろうか。その任務はほとんど不可能だ。大まかに言えば、これはニューラル ネットワークに 3 次元表面の読み取りを依頼したときに起こったことです。 を利用した技術の進歩により、ニューラルネットワークにも3次元を解釈・再現させる必要が生じました。
アムステルダム大学とAI リサーチの研究者は、幾何学的な機械学習に関する約 4 年間の研究を経て、気候モデルにおける台風であっても、気候モデルにおける腫瘍であっても、あらゆる幾何学的表面を読み取ることができる計測用人工知能を考案することに成功しました。試験。
等価性が研究の基礎となります。サッカー場を測定する場合(ヤードまたはメートル単位)や、建物を写真撮影する場合(下から、横から、または上から)のように、数値や画像は変化しますが、常に予測可能な方法で変化します。お互いに関係している。サッカー場と建物は変わらないという仮定は、測定人工知能がデータに関して行う仮定と同じです。
機械が二次元の表面を理解するために使用される手順は畳み込みと呼ばれますが、問題は、それが三次元または深さに適合しないことでした。それは、紙を使ってボールのデザインをコピーしようとするときの問題です。デザインが曲がってしまうか、紙がしわくちゃになってしまうのですが、その両方が起こらない場合です。
視点の変更
解決策は、紙ではなく、蜘蛛の巣のようなものを想像することでした。人工知能が椅子に座っているかのように情報を層状に理解する場合、人工知能を立ち上がらせて視点を変える必要があります。つまり、たとえば、肺はどこから来ても肺のままであることを人工知能に教える必要があります。側で彼は観察されています。
このアプローチの問題は、ニューラル ネットワークが何かを学習するために多くの情報を必要とすることです。彼女に犬の形を教えることが目的なら、インターネットにはさまざまな体位の画像が溢れています。世界には何百万頭もの犬がいますが、癌性結節となると話は別です。
Qualcomm AI Research の研究者 Taco Cohen は、ニューラル ネットワークに情報を供給するとデータ効率が向上することを知っていました。犬の場合は単純ですが、がんの場合は複雑になります。さまざまな向きの肺腫瘍の画像が何千枚も入手できないため、それらを取得して理解するには時間がかかります。
確実性に基づく仮定
つまり、犬は常に犬である、つまり 4 本の足、鼻、ひげがあると機械に認識させる必要がありました。 100 万枚の写真を見なくても、100 枚目の写真で、描かれている人物は犬であり、100 万枚目の写真に写っているのは犬であるとわかります。そのため、機械は「推測する」ことを学習しました。
2016 年、コーエンと同僚のモーリス ウェリングは、一般化を通じてこれらの仮定の一部を幾何学的対称としてニューラル ネットワークにエンコードすることに成功しました。このアプローチは非常にうまく機能し、2018 年にクアルコムの研究者兼エンジニアの Marysia Winkels は CT スキャンでの肺がんの認識において有望な結果を達成しました。
新しい人工知能はすでに医療だけでなく、球面モデルを使用した地球規模の気候データの分析にも応用されています。 2017 年には、標準的な AI が 74% の精度でサイクロンを検出しました。 2019 年、計測 AI は 97.9% の確率でサイクロンを正確に識別しました。 360° の視野を備えたドローンから、1 回の検査で目に見えない腫瘍を特定できる医療スキャナーまで、その用途は無数にあります。
人工知能はを通じて
ソース