💻 A curated list of papers and resources for multi-modal Graphical User Interface (GUI) agents.
Awesome-GUI-Agent 是一个精选的多模态图形用户界面(GUI)智能体资源库。它汇集了该领域前沿的学术论文、开源项目及数据集,致力于帮助开发者和研究者快速掌握 GUI 自动化代理的核心技术与发展动态。
该项目汇总了针对图形界面交互优化的基准数据集与评测工具,方便评估智能体的实际操作能力。
它详细梳理了当前主流的多模态模型与 GUI 智能体项目,为构建数字助手提供参考范例。
项目内置了便捷的辅助工具,支持通过 arXiv 链接自动生成标准的论文引用格式,显著简化了贡献者整理资料的流程。
资源库定期更新,确保用户能够及时获取 GUI 智能体领域的最新科研成果与技术方案。
该项目非常适合从事人工智能、多模态大模型及自动化交互领域的研究人员与开发者使用,是了解 GUI 智能体前沿技术栈的理想入口。