An LLM-based Web Navigating Agent (KDD'24)
AutoWebGLM 是一个基于大语言模型构建的自动化网页导航代理,旨在提升模型在复杂网页环境中的导航效率与实际操作能力。该项目以 ChatGLM3-6B 为核心,通过先进的算法与训练策略,帮助智能体更好地理解网页内容并完成自动化任务。
采用创新的 HTML 简化算法,在保留关键信息的同时提升了网页内容对大模型的可读性。 结合人类经验与人工智能知识进行混合训练,显著增强了模型在实际浏览场景中的导航技能。 利用强化学习与拒绝采样技术,提升了模型对网页的理解深度、操作执行能力及任务拆解效率。 内置包含中英文双语的 AutoWebBench 基准测试工具,为评估和优化网页导航代理提供了可靠的度量标准。
该项目主要面向人工智能研究人员及开发者,适用于构建自动化的 Web 交互应用、网页内容提取任务以及对大模型工具调用能力的深入测评场景。