脳スキャンは人々が見ているものを教えてくれます

テディベア、飛行機、教会の時計、電車。 画像は同一ではありませんが、類似性は紛れもないものです。日本の研究者は、以前に被験者に見せた画像を再構築するために脳スキャンを使用しました。

科学者たちはまだ人間の脳の仕組みを理解するのに苦労していますが、人工知能はこの研究のように、その仕組みを理解するのに役立ち始めています.

日本の大阪大学の 2 人の神経科学者が、4 人の被験者に異なる画像を見せ、同時に彼らの脳活動を追跡しました。 このシステムはまず、脳の活動領域の血流の変化を検出する機能的磁気共鳴画像法 (fMRI) スキャンからの情報を解釈しました。

人が写真を見ると、大脳皮質の特定の領域 (側頭葉) は、主に、それが人物であるか、物であるか、風景であるかなど、画像の内容に関する情報を登録します。 一方、別の領域 (頭の後ろにある後頭葉) は、主に画像の縮尺や位置など、レイアウトと遠近法に関する情報を扱います。 この情報はすべて fMRI によって記録されます。

数十億の画像を使用したトレーニング

脳スキャンから見た画像を推測できるようにするために、2 人の研究者は、ドイツのグループによって実装された Stable Diffusion と呼ばれる AI アルゴリズムを使用しました。 LMUミュンヘンでのビョルン・オマー 2022年に開発・リリースされました。

Stable Diffusion は、DALL-E 2 や Midjourney などの他の AI 画像ジェネレーターに似ています。これらは、テキストの説明を含む数十億の画像でトレーニングされた後、テキスト プロンプトに基づいて新しい画像を生成します。 脳を読み取ることができるようにするために、安定した放送は、参加者の対応する脳のパターンにリンクされた何千もの写真とキャプションを使用して追加のトレーニングを受けました.

できるだけ多くのクリエイティブなユーザーや他の研究グループに利益をもたらしたい

Björn Ommer 氏、LMU Munich の AI 開発者

「MRI信号は非常に粗い信号しか提供しません」と説明します AI 開発者ビョルン・オマー、「そして、Stable Diffusion はこのタスクに特に適していました。」 Ommer の研究グループは、無料で使用できるオープン ソース アプリケーションとして意図的に AI Image Generator を開発しました。 原則として、モデルはどの家庭でも通常のハードウェアで実行できるため、ユーザーは少数の大企業のコンピューティング能力に依存しません。

これを行うには、何十億ものトレーニング画像のデータを、数百テラバイトが本質的に 10 ギガバイト未満になるように圧縮する必要がありました。 比較的まばらで低解像度のデータから詳細な画像を生成する機能は、現在、脳スキャンの分析に役立っています。

未来を紡ぐ

Ommer は、彼の AI を使用した日本の研究者とまだ接触していません。 現在、世界中の何百万人もの人々が Stable Diffusion を使用しており、Ommer も同じようにするつもりです。 シリコンバレーの一部だけでなく、他の研究グループも恩恵を受け、未来を紡ぎ続けています。

「この新しい方法の正確さは印象的です」と、アムステルダム大学の神経科学者である Iris Groen 氏は、日本の研究についてコメントしています。 科学誌で. 仕事はここまでです プレプリントで公開、つまり、専門誌の専門家によってまだ評価されていません。 しかし、Groen 氏は、認知神経科学研究の新たな機会を生み出す可能性がある「リアルな画像を生成する前例のない能力」について語っています。

ただし、研究者はこれまでのところ、AI が訓練された被験者の脳ス​​キャンを解釈することしかできませんでした。 すべての脳は異なるため、この方法を一般的に適用することはまだできません。 しかし、技術がさらに進歩すれば、思考や夢を傍受することも考えられます。 また、動物が現実をどのように認識しているかをよりよく理解できる可能性もあります。

ホームページへ

Wakabayashi Chie

「熱心なトラブルメーカー。アマチュア旅行の第一人者。熱心なアルコール愛好家。ゾンビ学者。」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です