Фреймворк A-Evolve поднимает результаты без ручной настройки.
Исследователи Amazon и Университета Пенсильвании выпустили open-source фреймворк A-Evolve, который автоматически улучшает ИИ-агента. Вместо ручного тюнинга система запускает агента-эволюционера: он модифицирует промпты, скиллы и инструменты, прогоняет изменения через бенчмарки и оставляет только те, что дают прирост. Весь процесс фиксируется через git.
На бенчмарке MCP-Atlas эволюция подняла агента на Claude Opus 4.6 до 79,4% — первое место в рейтинге. Прирост на других тестах — до 15 процентных пунктов. Для запуска достаточно трёх строк кода на Python.
Фреймворк работает с LLM от Anthropic, OpenAI и Amazon Bedrock. Это не дообучение модели, а эволюция поведения агента через управляемые мутации его конфигурации. Подробности о технике, бенчмарках и коде читайте в материале.
Источник: Типичный программист






