心を解読する:神経科学と生成AIが新たな脳と機械のインターフェースを設計

これは、MITテクノロジーレビューイタリアの依頼で私が行ったインタビューの要約です。

この記事では、2023年の研究で機能的MRI(fMRI)データとStable Diffusion生成AIモデルを統合し、脳活動を画像に変換する手法を提案した日本の神経科学者Yu Takagi氏へのインタビューを紹介します。

研究の焦点を

Takagi氏は、人工知能人間神経科学の交差点で研究を行い、両者を理解し接続することを目指しています。現在の研究では、大規模言語モデルと人間脳機能の比較を行い、脳と機械の統合を追求しています。

研究の主要な要素

  • モデル選択:改変されていない、自由に利用可能なStable Diffusionモデルを使用しました。
  • データセットNatural Scene Datasetが不可欠でした。オープンデータセットとオープンソースモデルは進歩に不可欠です。
  • アプローチ:fMRI信号とAI出力の単純なマッピングを実施。リソースの制約から微調整は行いませんでした。
  • 制限事項:MRIの解像度が比較的低いため、再構築された画像の詳細が制限されます。

脳-コンピュータインターフェース(BCI)の潜在的可能性

  • 侵襲的BCI(Neuralinkのような埋め込みデバイス)はデータ品質を劇的に向上させる可能性がありますが、現在は医療患者に限定されています。
  • 非侵襲的BCIは、少なくとも5~10年間は埋め込みデバイスの精度に追いつくのは困難です。
  • 技術的課題:帯域幅、発熱、長期的な安全性。

応用

  • 感覚障害や言語障害のある人向けの支援ツール。
  • 神経科学と高度なモデルを組み合わせたマルチモーダルAIシステムの開発。
  • トランスヒューマニズムの長期的な可能性——義肢や埋め込みデバイスによる人間の能力向上、脳間通信の実現可能性。

リスクとガバナンス

  • データセットのバイアスは、誤ラベル付けや操作により現実や認識を歪める可能性があります。
  • 独立した監視機関の設立が必要で、データセットの品質、中立性、政治的悪用への耐性を確保する必要があります。
  • AIモデルは科学的に中立であるべきです。倫理はモデルの処理範囲ではなく、使用を規制すべきです。

逆応用と仲介現実

  • 理論上、AIは外部画像から特定の脳活動を刺激し、「仲介現実」または仮想世界を作成できる可能性があります。
  • 今後10年間で重大な突破口は期待できませんが、長期的に可能性はあります。
  • 自律性、思考の自由、国家の支配に関する深刻な倫理的懸念を提起します。

A longer text in English is here.