Official Repo for ICML 2024 paper "Executable Code Actions Elicit Better LLM Agents" by Xingyao Wang, Yangyi Chen, Lifan Yuan, Yizhe Zhang, Yunzhu Li, Hao Peng, Heng Ji.
CodeAct 是一个旨在统一大语言模型(LLM)智能体动作空间的研究项目,通过将可执行代码作为智能体的核心交互语言来替代传统的文本或 JSON 格式。该方案有效解决了智能体在执行复杂任务时指令理解偏差和交互效率低下的问题,大幅提升了模型完成任务的成功率。
该项目引入了将可执行代码作为统一动作空间的交互框架,使智能体能通过代码执行结果进行动态自我修正。配套发布了名为 CodeActInstruct 的大规模指令微调数据集,包含七千条多轮交互数据以增强模型的任务执行能力。提供了基于 Mistral-7b 构建的专用 Agent 模型,在保持通用对话能力的同时显著提升了领域外任务的表现。支持多种部署方式,包括 Ollama、llama.cpp 以及基于 Kubernetes 的集群部署方案,方便开发者在不同硬件环境进行集成与测试。
该项目适用于研究大语言模型智能体架构及指令微调的开发者与科研人员,特别适合需要构建高性能自动化任务处理、数据分析或复杂交互型 Agent 的应用场景。