An LLM-based Web Navigating Agent (KDD'24)
AutoWebGLM 是一个基于大语言模型的自动化网页导航智能体,旨在通过增强模型在真实网页环境中的交互与操作能力,解决复杂网络任务执行效率低的问题。该项目基于 ChatGLM3-6B 开发,通过对网页结构的深度优化与强化学习训练,显著提升了 AI 在互联网浏览过程中的任务规划与执行表现。
创新性的 HTML 简化算法能够提取网页核心信息,使模型更精准地理解页面布局与功能。 采用人机混合训练模式,通过结合人类经验与 AI 数据构建课程,有效强化了模型在真实场景下的导航技巧。 集成强化学习与拒绝采样技术,显著提升了智能体对网页内容的语义理解、浏览器指令操作及复杂任务的拆解能力。 配套发布 AutoWebBench 双语基准测试集,为开发者提供了一个评估与优化 AI 网页导航性能的权威评价体系。
该项目适用于人工智能研究人员与开发者,可广泛应用于自动化网页测试、智能信息采集以及各类需要 AI 替代人工进行浏览器自动化操作的场景。