AI技術2026年6月27日 12:19

シンガポール大、AIのメモリ管理を刷新する新手法を開発

シンガポール国立大学の研究チームが、AIエージェントのメモリ管理を刷新するフレームワーク「MRAgent」を開発した。従来型の検索・推論を分離したアプローチに代わり、推論しながら動的にメモリを再構築する仕組みを採用しており、比較対象の別フレームワークと比べてトークン消費量を大幅に削減できるとしている。長期にわたる複雑なタスクでのAIエージェント活用を現実的なものにする技術として注目される。

シンガポール国立大学の研究チームが、AIエージェントのメモリ管理を根本から見直した新しいフレームワーク「MRAgent（Memory Reasoning Architecture for LLM Agents）」を開発した。従来型の「検索してから推論する」という固定的なアプローチを捨て、推論しながら動的にメモリを再構築する仕組みを採用している。この手法により、他の同種フレームワークと比べてトークン消費量と処理コストを大幅に削減できるという。

そもそも、AIエージェントが複数のステップにわたって複雑な推論を行う「長期タスク」では、コンテキストウィンドウ（LLMが一度に処理できる情報量の枠）がすぐにいっぱいになってしまうという問題がある。従来の検索パイプラインは、ベクトル検索やグラフ探索でドキュメントを取得したあと、その結果をまとめてLLMに渡す仕組みだ。しかしこの方式では、推論の途中で新たな手がかりが見つかっても検索戦略を修正できないほか、関係の薄い情報まで大量にコンテキストに流れ込んでしまう。結果として、推論の精度が落ちるという根本的な課題が残っていた。

研究チームはこの問題を、認知神経科学における「記憶の再構築」という概念から着想を得て解決しようとした。人間の記憶想起が静的なデータベースの読み出しではなく、小さな手がかりから連想を積み重ねる逐次的なプロセスであるように、MRAgentも同様の動作を行う。具体的には、ユーザーの質問に含まれる人名・行動・場所といった小さな手がかりを起点に、構造化されたメモリグラフ上で複数の候補パスを探索する。そのつど得られた中間的な証拠をLLMが評価し、次の検索条件を絞り込みながら、不要な経路を枝刈りして最適なパスを追い続ける仕組みだ。

この「推論と検索を同時に行う」アーキテクチャが、トークン効率の面で大きな差を生む。原文によると、比較対象となった別のエージェントメモリフレームワーク「LangMem」が1クエリあたり約326万トークンを消費するのに対し、MRAgentは約11万8000トークンにとどまるとされる。必要な情報だけを段階的に積み上げる設計が、無駄な情報の読み込みを抑えることで、コストと速度の両面での改善につながっている。

この研究が持つ意味は、コスト削減にとどまらない。長期にわたる対話や複雑な調査タスクへのAIエージェントの活用は今後さらに広がると見られるが、そのボトルネックはまさにメモリ管理の非効率さにある。MRAgentのように推論とメモリ再構築を統合するアプローチは、エージェントが「道具として使えるレベル」に近づくための重要な一歩と位置づけられる。静的なデータベースを参照するだけの受動的な検索から、能動的に文脈を組み立てる方向への転換という点で、研究の方向性自体に注目する価値があるといえる。

今後の焦点は、このフレームワークが実際のプロダクション環境でどこまでスケールするかという点にある。現時点では研究段階の成果であり、様々なドメインや条件下での実証がさらに必要だ。一方で、メモリ管理の設計思想そのものが「静的な検索」から「動的な再構築」へと移行しつつあるという流れは、この研究だけが示すものではなく、分野全体の方向性とも重なる。実用化に向けた検証の進展が注目される。

#AIエージェント#LLM#メモリ管理#RAG#自然言語処理#シンガポール国立大学#生成AI

AI issue 編集部

コメントするにはログイン