PaSa -- an advanced paper search agent powered by large language models. It can autonomously make a series of decisions, including invoking search tools, reading papers, and selecting relevant references, to ultimately obtain comprehensive and accurate results for complex scholarly queries.
PaSa 是一个由字节跳动研究团队开发的学术论文搜索智能体,旨在利用大语言模型实现自动化研究查询。该项目通过自主决策流程,能够执行调用搜索工具、深度阅读论文及筛选相关文献等任务,从而为复杂的学术需求提供全面且精准的搜索结果。
该系统由爬虫和筛选器两个智能体组成,前者负责自主决策是否调用搜索工具、扩展引用或停止处理当前论文。系统支持基于学术需求的自动化深度检索,通过分析论文队列中的内容进行精准筛选。项目经过强化学习优化,模型在真实学术查询数据集上的表现显著优于包括谷歌搜索及 GPT-4o 在内的现有基准方法。项目提供了高质量的学术查询数据集 AutoScholarQuery,包含 3.5 万条细粒度学术查询及对应论文。
该工具适用于科研人员、学生及学术情报分析人员,特别是在需要处理复杂学术命题、进行文献综述或快速获取高质量学术参考资料的场景下使用。用户可以通过官方网页版演示系统直接输入学术需求,快速获取精准的论文检索建议。