これは、MITテクノロジーレビューイタリアの依頼で私が行ったインタビューの要約です。
この記事では、2023年の研究で機能的MRI(fMRI)データとStable Diffusion生成AIモデルを統合し、脳活動を画像に変換する手法を提案した日本の神経科学者Yu Takagi氏へのインタビューを紹介します。
研究の焦点を
Takagi氏は、人工知能と人間神経科学の交差点で研究を行い、両者を理解し接続することを目指しています。現在の研究では、大規模言語モデルと人間脳機能の比較を行い、脳と機械の統合を追求しています。
研究の主要な要素
- モデル選択:改変されていない、自由に利用可能なStable Diffusionモデルを使用しました。
- データセット:Natural Scene Datasetが不可欠でした。オープンデータセットとオープンソースモデルは進歩に不可欠です。
- アプローチ:fMRI信号とAI出力の単純なマッピングを実施。リソースの制約から微調整は行いませんでした。
- 制限事項:MRIの解像度が比較的低いため、再構築された画像の詳細が制限されます。
脳-コンピュータインターフェース(BCI)の潜在的可能性
- 侵襲的BCI(Neuralinkのような埋め込みデバイス)はデータ品質を劇的に向上させる可能性がありますが、現在は医療患者に限定されています。
- 非侵襲的BCIは、少なくとも5~10年間は埋め込みデバイスの精度に追いつくのは困難です。
- 技術的課題:帯域幅、発熱、長期的な安全性。
応用
- 感覚障害や言語障害のある人向けの支援ツール。
- 神経科学と高度なモデルを組み合わせたマルチモーダルAIシステムの開発。
- トランスヒューマニズムの長期的な可能性——義肢や埋め込みデバイスによる人間の能力向上、脳間通信の実現可能性。
リスクとガバナンス
- データセットのバイアスは、誤ラベル付けや操作により現実や認識を歪める可能性があります。
- 独立した監視機関の設立が必要で、データセットの品質、中立性、政治的悪用への耐性を確保する必要があります。
- AIモデルは科学的に中立であるべきです。倫理はモデルの処理範囲ではなく、使用を規制すべきです。
逆応用と仲介現実
- 理論上、AIは外部画像から特定の脳活動を刺激し、「仲介現実」または仮想世界を作成できる可能性があります。
- 今後10年間で重大な突破口は期待できませんが、長期的に可能性はあります。
- 自律性、思考の自由、国家の支配に関する深刻な倫理的懸念を提起します。
A longer text in English is here.
