Official Repo for ICML 2024 paper "Executable Code Actions Elicit Better LLM Agents" by Xingyao Wang, Yangyi Chen, Lifan Yuan, Yizhe Zhang, Yunzhu Li, Hao Peng, Heng Ji.
CodeAct 是一个旨在提升大语言模型智能体交互能力的框架,它将原本分散的动作指令统一为可执行的 Python 代码空间。通过与 Python 解释器深度集成,该项目能让模型以代码作为动作载体,根据执行反馈动态调整策略并执行多轮交互,从而显著提高复杂任务的成功率。
通过将代码执行作为核心交互范式,统一了智能体在复杂场景下的动作空间。 结合内置的 Python 解释器,能够根据执行结果实时修正错误或生成后续动作。 提供经过精选的高质量指令微调数据集 CodeActInstruct,增强了模型的任务规划与执行能力。 支持多种部署方式,包括 Ollama 本地化运行、Llama.cpp 轻量级推理以及 Kubernetes 集群化服务部署。 在多项基准测试中表现优异,相比传统的文本或 JSON 交互格式,成功率提升最高可达 20%。
该项目适用于大模型研究人员与开发者,旨在构建更高性能、更具推理能力的智能体应用,特别是在需要自动化任务处理、数据分析及复杂工具调用的场景中表现突出。