싱가포르국립대, AI의 메모리 관리를 혁신하는 새로운 기법 개발
싱가포르국립대학 연구팀이 AI 에이전트의 메모리 관리를 혁신하는 프레임워크 'MRAgent'를 개발했다. 기존의 검색과 추론을 분리한 접근 방식을 대신하여, 추론하면서 동적으로 메모리를 재구축하는 메커니즘을 채택했으며, 비교 대상이 된 다른 프레임워크와 비교할 때 토큰 소비량을 대폭 줄일 수 있다고 한다. 장기에 걸친 복잡한 작업에서의 AI 에이전트 활용을 현실적으로 만드는 기술로 주목된다.

싱가포르국립대학 연구팀이 AI 에이전트의 메모리 관리를 근본적으로 재검토한 새로운 프레임워크 'MRAgent(Memory Reasoning Architecture for LLM Agents)'를 개발했다. 기존의 '검색한 후 추론한다'는 고정적인 접근 방식을 버리고, 추론하면서 동적으로 메모리를 재구축하는 메커니즘을 채택했다. 이 기법으로 인해 다른 동종 프레임워크와 비교할 때 토큰 소비량과 처리 비용을 대폭 줄일 수 있다고 한다.
원래 AI 에이전트가 여러 단계에 걸쳐 복잡한 추론을 수행하는 '장기 작업'에서는 컨텍스트 윈도우(LLM이 한 번에 처리할 수 있는 정보량의 범위)가 금방 가득 차버린다는 문제가 있다. 기존의 검색 파이프라인은 벡터 검색이나 그래프 탐색으로 문서를 가져온 후, 그 결과를 모아서 LLM에 전달하는 구조다. 하지만 이 방식에서는 추론 도중에 새로운 단서가 발견되어도 검색 전략을 수정할 수 없을 뿐만 아니라, 관련성이 낮은 정보까지 대량으로 컨텍스트에 흘러들어온다. 결과적으로 추론의 정확도가 떨어진다는 근본적인 과제가 남아있었다.
연구팀은 이 문제를 인지신경과학의 '기억의 재구축'이라는 개념에서 영감을 얻어 해결하려고 했다. 인간의 기억 회상이 정적인 데이터베이스의 읽기가 아니라 작은 단서로부터 연상을 쌓아가는 순차적 과정이듯이, MRAgent도 마찬가지의 동작을 수행한다. 구체적으로는 사용자의 질문에 포함된 인명, 행동, 장소 같은 작은 단서를 출발점으로 삼아, 구조화된 메모리 그래프 위에서 여러 후보 경로를 탐색한다. 그때마다 얻어진 중간 증거를 LLM이 평가하고, 다음 검색 조건을 좁혀가면서 불필요한 경로를 가지치기하여 최적의 경로를 추적해나가는 메커니즘이다.
이 '추론과 검색을 동시에 수행하는' 아키텍처가 토큰 효율 측면에서 큰 차이를 만든다. 원문에 따르면, 비교 대상이 된 다른 에이전트 메모리 프레임워크 'LangMem'이 쿼리당 약 326만 토큰을 소비하는 반면, MRAgent는 약 11만 8000토큰에 머문다고 한다. 필요한 정보만 단계적으로 쌓아가는 설계가 불필요한 정보의 로딩을 억제함으로써 비용과 속도 양면에서의 개선으로 이어지고 있다.
이 연구가 가지는 의미는 비용 절감에 그치지 않는다. 장기에 걸친 대화나 복잡한 조사 작업으로의 AI 에이전트 활용은 앞으로 더욱 확대될 것으로 예상되지만, 그 병목은 바로 메모리 관리의 비효율성에 있다. MRAgent처럼 추론과 메모리 재구축을 통합하는 접근 방식은, 에이전트가 '도구로서 사용할 수 있는 수준'에 가까워지기 위한 중요한 한 걸음으로 자리매김된다. 정적인 데이터베이스를 참조하기만 하는 수동적인 검색에서, 능동적으로 문맥을 구축하는 방향으로의 전환이라는 점에서, 연구의 방향성 자체에 주목할 가치가 있다고 할 수 있다.
향후 초점은 이 프레임워크가 실제 프로덕션 환경에서 어느 정도까지 확장될 수 있는가 하는 점에 있다. 현 시점에서는 연구 단계의 성과이며, 다양한 도메인과 조건 하에서의 실증이 추가로 필요하다. 한편, 메모리 관리의 설계 사상 자체가 '정적인 검색'에서 '동적인 재구축'으로 이행하고 있다는 흐름은, 이 연구만이 보여주는 것이 아니라 분야 전체의 방향성과도 맞닿아있다. 실용화에 향한 검증의 진전이 주목된다.
본 기사는 AI issue 편집부가 사실(fact)을 바탕으로 독자적으로 작성·편집한 저작물입니다. 저작권은 AI issue에 있으며, 무단 전재·재배포 및 AI 학습·활용을 금합니다.