AI 驱动的学术论文配图生成平台。上传论文 → AI 分析内容生成 Prompt → 一键生成高质量科研配图,还有配套的skill可在主流agent中使用
930
Stars
74
Forks
2
Watchers
6
Issues
AI 驱动的学术论文配图生成工具(个人本地版)。上传论文 → AI 分析内容生成 Prompt → 一键生成高质量科研配图。
一句话:把“写完论文还要画图”的痛点,变成“上传 → 确认 → 下载”三步流程。
以下均为本平台实际生成的学术配图示例:
PMST 预测网络架构图
时频域信号处理流程图
深度学习模块详解图
带标注的解剖结构图
| 功能 | 说明 |
|---|---|
| 🤖 智能 Prompt 生成 | 上传 PDF/DOCX/TXT 论文,Claude AI 自动分析内容并生成配图描述 |
| 🖼️ 高质量配图 | 支持 1K/2K/4K 多分辨率,16:9/4:3/1:1 等多种比例 |
| 🎨 配色方案 | 50+ 预设学术配色(含色盲友好方案),支持自定义配色 |
| ✏️ 图生图编辑 | 基于已有图片 + 文字指令进行二次编辑 |
| ⚡ 实时状态 | SSE 流式推送生成进度,无需手动刷新 |
| 📁 项目管理 | 按项目组织论文、Prompt 和配图 |
| 层级 | 技术 |
|---|---|
| 后端 | FastAPI · SQLAlchemy (Async) · Python 3.12+ |
| 前端 | React 19 · TypeScript · Vite · Tailwind CSS · Radix UI |
| 数据库 | SQLite (自动创建,零配置) |
| 存储 | 本地文件系统 (backend/data/) |
| AI (Prompt) | Claude Agent SDK (claude-agent-sdk) |
| AI (配图) | NanoBanana / Gemini API |
academic-figure-generator/
├── backend/ # FastAPI 后端
│ ├── app/
│ │ ├── api/v1/ # API 路由 (projects, documents, prompts, images, color_schemes)
│ │ ├── models/ # SQLAlchemy ORM 模型 (SQLite)
│ │ ├── schemas/ # Pydantic 请求/响应 Schema
│ │ ├── services/ # 业务逻辑层
│ │ │ ├── claude_code_service.py # Claude Agent SDK 集成
│ │ │ ├── local_storage_service.py # 本地文件存储
│ │ │ ├── image_service.py # NanoBanana 图片生成
│ │ │ ├── document_service.py # PDF/DOCX/TXT 解析
│ │ │ └── prompt_service.py # Prompt CRUD
│ │ ├── core/ # 中间件、异常处理、Prompt 模板/配色
│ │ ├── config.py # 环境变量配置
│ │ └── main.py # FastAPI 应用工厂
│ ├── data/ # 运行时数据 (SQLite DB, 上传文件, 生成图片)
│ └── pyproject.toml
├── frontend/ # React SPA 前端
│ ├── src/
│ │ ├── pages/ # 页面组件 (Projects, ProjectWorkspace, Generate, ColorSchemes, Settings)
│ │ ├── components/ui/ # Radix UI 组件库
│ │ ├── store/ # Zustand 状态管理
│ │ └── lib/ # API 客户端
│ ├── package.json
│ └── vite.config.ts
├── academic-figure-prompt/ # AI Coding Agent Skill (SKILL.md)
├── .env # 环境变量
└── README.md
git clone https://github.com/LigphiDonk/academic-figure-generator.git
cd academic-figure-generator
编辑项目根目录的 .env 文件:
# Claude Agent SDK (用于 Prompt 生成)
ANTHROPIC_API_KEY=your-anthropic-api-key
# NanoBanana / Gemini API (用于图片生成)
NANOBANANA_API_KEY=your-nanobanana-api-key
NANOBANANA_API_BASE=https://api.keepgo.icu
NANOBANANA_MODEL=gemini-3-pro-image-preview
cd backend
# 创建虚拟环境 (推荐)
python -m venv .venv
source .venv/bin/activate # macOS/Linux
# 安装依赖
pip install -e .
# 启动开发服务器
uvicorn app.main:app --host 0.0.0.0 --port 8000 --reload
首次启动时会自动创建 SQLite 数据库 (backend/data/app.db) 和数据目录。
cd frontend
npm install
npm run dev
| 服务 | 地址 |
|---|---|
| 应用首页 | http://localhost:5173 |
| API 文档 (Swagger) | http://localhost:8000/docs |
上传论文 (PDF/DOCX/TXT)
│
▼
后端解析 → 提取文本和章节结构
│
▼
Claude Agent SDK → 分析论文 → 生成配图 Prompt
│
▼
确认/编辑 Prompt → 选择分辨率和比例
│
▼
NanoBanana API → 生成高质量配图
│
▼
下载图片 / 图生图编辑
除了项目工作流,还支持快捷生成模式:直接输入 Prompt 文本,跳过论文上传步骤,快速生成配图。
浏览器 (React SPA)
│
▼
FastAPI 后端 (localhost:8000)
│
├── SQLite (项目、文档、Prompt、图片元数据)
├── 本地文件系统 (上传文件、生成图片)
│
├── Claude Agent SDK → Prompt 生成 (同步)
└── NanoBanana API → 图片生成 (异步后台任务)
| 变量 | 必填 | 默认值 | 说明 |
|---|---|---|---|
ANTHROPIC_API_KEY | 是 | — | Claude Agent SDK API Key |
NANOBANANA_API_KEY | 是 | — | NanoBanana / Gemini API Key |
NANOBANANA_API_BASE | 否 | https://api.keepgo.icu | NanoBanana API 地址 |
NANOBANANA_MODEL | 否 | gemini-3-pro-image-preview | 图片生成模型 |
DATABASE_PATH | 否 | ./data/app.db | SQLite 数据库路径 |
DATA_DIR | 否 | ./data | 数据存储目录 |
DEBUG | 否 | true | 调试模式 (启用 API 文档) |
CORS_ORIGINS | 否 | ["http://localhost:3000","http://localhost:5173"] | CORS 允许来源 |
MAX_UPLOAD_SIZE_MB | 否 | 50 | 最大上传文件大小 (MB) |
本项目附带了一个独立的 AI Coding Agent Skill——academic-figure-prompt,兼容多种 AI 编程助手(Claude Code / Gemini CLI / Cursor 等),无需部署完整平台即可获得顶会级学术论文配图提示词生成能力。
academic-figure-prompt 是一个专为学术论文设计的 AI 提示词生成器,能够:
Academic Figure Generator 是一个 AI 驱动的学术论文配图生成平台,旨在解决科研人员在论文写作后期手动绘制复杂配图的耗时难题。该项目通过本地化部署与 AI 深度整合,实现了从论文内容分析到高质量学术配图的一键式自动化生成。
支持通过上传 PDF、DOCX 或 TXT 格式的论文,利用 AI 自动分析并提取关键信息以生成精准的绘画提示词。提供多分辨率及多种比例设置,满足不同期刊对配图规格的严格要求。内置数十种预设学术配色方案,并支持基于现有图片进行二次编辑。通过流式进度推送与项目化管理模式,显著提升科研人员的制图效率与协作体验。
该项目非常适合需要频繁撰写高质量论文的科研人员、研究生及学术团队,适用于从研究架构图、流程图到数据分析图等多种科研场景。