Mem0发布长效记忆架构研究:准确率领先OpenAI26%,推理延迟降低91%

robot
Генерация тезисов в процессе
МЕ Новости, 17 апреля (UTC+8), по данным мониторинга Дунчá Beating, платформа персонализированной AI-памяти Mem0 недавно опубликовала результаты исследования своего основного алгоритма долговременной памяти. Экспериментальные данные показывают, что в тесте LOCOMO точность ответов Mem0 превышает встроенную функцию памяти OpenAI на 26%, а благодаря механизму поиска «фактической» информации, задержка P95 при выводе снизилась на 91%, а расход токенов сократился на 90%.
Основная проблема, которую решает этот алгоритм, — «забывчивость» AI-агентов при длительных взаимодействиях. В отличие от простого расширения контекстного окна LLM, Mem0 использует двухэтапную обработку: на «этапе извлечения» система извлекает ключевые факты из последних диалогов, скользящих резюме и историй; на «этапе обновления» система сравнивает данные с помощью векторной базы данных, выполняя операции добавления, обновления, удаления конфликтующих или игнорируемых данных, обеспечивая компактность и согласованность памяти.
В исследовании также представлен улучшенный вариант Mem0ᵍ. Эта версия вводит структуру графовой базы данных, преобразуя извлечённые факты в помеченные узлы и связи, что позволяет захватывать сложные отношения между сущностями в нескольких сессиях. В реальных производственных условиях Mem0 способен завершить полный цикл поиска памяти и генерации ответа за 0,71 секунды, тогда как традиционный метод «весь контекст» требует около 10 секунд.
На данный момент данное исследование было принято на Европейской конференции по искусственному интеллекту (ECAI), соответствующий код открыт на GitHub. (Источник: BlockBeats)
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • 8
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
NightFlightMint
· 1ч назад
Двухэтапное извлечение ключевых фактов, не потеряется ли информация на первом этапе
Посмотреть ОригиналОтветить0
ApeWithNotes
· 1ч назад
От забывчивости к долговременной памяти — эта проблема решена точно
Посмотреть ОригиналОтветить0
BorrowingBuddy
· 1ч назад
P95 задержка снизилась на 91%, оптимизация длинного хвоста сложнее, чем средняя задержка
Посмотреть ОригиналОтветить0
GateUser-f78f1f3e
· 1ч назад
Время поиска по памяти 0,71 секунды, сможет ли производственная среда выдержать высокую нагрузку?
Посмотреть ОригиналОтветить0
MintColdBrew
· 1ч назад
Использование графовой базы данных для межсессионных отношений между сущностями — это очень умное направление для улучшения.
Посмотреть ОригиналОтветить0
NightFlightPaperCrane
· 1ч назад
Встроенная память OpenAI действительно бесполезна, наконец-то кто-то серьезно занялся этим
Посмотреть ОригиналОтветить0
GateUser-4bd1cc87
· 1ч назад
LOCOMO базовая производительность на 26% выше, чем у OpenAI, а что за конкретный сценарий тестирования?
Посмотреть ОригиналОтветить0
  • Закреплено