© 2026FindAgent  · @simprr
返回列表
W

WangRongsheng/awesome-LLM-resources

🧑‍🚀 全世界最好的LLM资料总结(多模态生成、Agent、辅助编程、AI审稿、数据处理、模型训练、模型推理、o1 模型、MCP、小语言模型、视觉语言模型) | Summary of the world's best LLM resources.

awesome-listbookcourselarge-language-modelsllamallmmistralopenaiqwenragretrieval-augmented-generationwebui
⭐

7.9k

Stars

🔱

802

Forks

👁

88

Watchers

📋

14

Issues

Apache-2.0创建于 2024/4/19更新于 今天
在 GitHub 上查看
README
由 Gemini 翻译整理

全世界最好的大语言模型资源汇总,持续更新。

[!TIP] 如果您对医疗数据集/大模型/多模态/评估相关资源感兴趣!请访问我们的 🤗 Awesome-AI4Med !


目录

  • 推荐 Suggestion
  • 数据 Data
  • 微调 Fine-Tuning
  • 智能体强化学习 Agentic RL
  • 推理 Inference
  • 评估 Evaluation
  • 体验 Usage
  • 知识库 RAG
  • 智能体 Agents
  • 研究 Research
  • 代码 Coding
  • 视频 Video
  • 图片 Image
  • 搜索 Search
  • 语音 Speech
  • 统一模型 Unified Model
  • 书籍 Book
  • 课程 Course
  • 教程 Tutorial
  • 论文 Paper
  • 社区 Community
  • 模型上下文协议 MCP
  • 技能 Skills
  • 推理 Open o1
  • 推理 Open o3
  • 小语言模型 Small Language Model
  • 小多模态模型 Small Vision Language Model
  • 技巧 Tips

推荐 Suggestion

播客 (Podcast)

  • A 7-hour marathon interview with Saining Xie: World Models, AMI Labs, Yann LeCun, Fei-Fei Li, and 42
  • 翁家翌:OpenAI,GPT,强化学习,Infra,后训练,天授,tuixue,开源,CMU,清华|WhynotTV Podcast
  • Lovart 创始人陈冕×罗永浩!且让我大闹一场,然后悄然离去
  • MiniMax 创始人闫俊杰×罗永浩!大山并非无法翻越
  • 影视飓风TIM×罗永浩!用影像打开世界的梦想家
  • 129. 全球大模型第一股的上市访谈,和智谱CEO张鹏聊:敢问路在何方?
  • 128. Manus决定出售前最后的访谈:啊,这奇幻的2025年漂流啊…
  • 122. 朱啸虎现实主义故事的第三次连载:人工智能的盛筵与泡泡
  • 119. Kimi Linear、Minimax M2?和杨松琳考古算法变种史,并预演未来架构改进方案
  • 118. 对李想的第二次3小时访谈:CEO大模型、MoE、梁文锋、VLA、能量、记忆、对抗人性、亲密关系、人类的智慧
  • 115. 对OpenAI姚顺雨3小时访谈:6年Agent研究、人与系统、吞噬的边界、既单极又多元的世界
  • 113. 和杨植麟时隔1年的对话:K2、Agentic LLM、缸中之脑和“站在无限的开端”

数据 Data

[!NOTE]

此处命名为数据,但这里主要提供的并非具体数据集,而是用于处理和获取大规模数据的方法。

  1. AotoLabel: 利用 LLM 对文本数据集进行标注、清洗和增强。
  2. LabelLLM: 开源数据标注平台。
  3. data-juicer: 一站式数据处理系统,旨在提升数据质量,使其更易于 LLM 理解和消化。
  4. OmniParser: 一个基于 Golang 的原生 ETL 流式解析与转换库,支持 CSV、JSON、XML、EDI、文本等格式。
  5. MinerU (🔥): 一站式开源高质量数据提取工具,支持 PDF、网页、电子书提取。
  6. PDF-Extract-Kit: 用于高质量 PDF 内容提取的综合工具包。
  7. Parsera: 用于利用 LLM 抓取网站的轻量级库。
  8. Sparrow: 创新的开源解决方案,用于高效从各类文档和图像中提取及处理数据。
  9. Docling: 为生成式 AI 准备文档的工具。
贡献者
WlSacwfhys
项目信息
默认分支main
LicenseApache License 2.0
创建时间2024/4/19
最近更新今天
GAI 中文摘要

awesome-LLM-resources 是一个高质量的大语言模型资源整合仓库,旨在为开发者、研究人员及爱好者提供全面且持续更新的行业资料。该项目通过对多模态、Agent、RAG、模型训练与推理等关键领域进行分类梳理,有效解决了AI领域信息碎片化严重、获取门槛高的问题。

项目涵盖了从数据处理、模型微调到推理部署的全流程技术文档与工具推荐。核心模块包含智能体开发、模型上下文协议(MCP)、辅助编程、视觉语言模型及小语言模型等前沿方向。提供丰富的学术论文、行业书籍、在线课程及视频教程资源,深度覆盖从入门到高阶的知识体系。整理了主流开源社区及开发技巧,便于用户快速定位并利用优质资源进行项目实践。

该项目适用于AI开发者、学生、研究员以及希望深入探索LLM技术的从业者,是构建知识库、进行模型调研或开展AI应用的必备案头工具。