© 2026FindAgent  · @simprr
返回列表
S

SharpAI/DeepCamera

Open-Source AI Camera Skills Platform, AI NVR & CCTV Surveillance. Local VLM video analysis with Qwen, DeepSeek, SmolVLM, LLaVA, YOLO26. LLM-powered agentic security camera agent — watches, understands, remembers & guards your home via Telegram, Discord or Slack. Pluggable AI skills. OpenAI, Google, Anthropic or local AI. Runs on Mac Mini & AI PC.

aiai-cameraai-nvrcameracctvcomputer-visiondeep-learningface-recognitionhome-assistanthome-securityllama-cppllmlocal-aimachine-learningobject-detectionpythonraspberry-pisecurity-cameravideo-surveillancevlm
⭐

2.6k

Stars

🔱

415

Forks

👁

63

Watchers

📋

3

Issues

JavaScriptMIT创建于 2019/3/5更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

DeepCamera — 开源 AI 摄像头技能平台

DeepCamera 的开源技能赋予了你的摄像头 AI 能力——包括 VLM 场景分析、目标检测和人员重识别(Re-ID),所有功能均通过 Qwen、DeepSeek、SmolVLM 和 LLaVA 等模型在本地运行。该平台构建于经过验证的人脸识别、重识别、跌倒检测及 CCTV/NVR 监控技术之上,通过现代 AI 技术进一步扩展了这些机器学习功能。所有推理过程均在本地执行,以实现最大限度的隐私保护。


🛡️ 隆重介绍 SharpAI Aegis — DeepCamera 桌面端应用

通过桌面应用使用 DeepCamera 的 AI 技能,享受由 LLM 驱动的环境设置、智能体聊天和智能警报——并可通过 Discord / Telegram / Slack 连接到你的移动设备。

SharpAI Aegis 是 DeepCamera 的桌面端伴侣。它利用 LLM 自动设置你的运行环境、配置摄像头技能并管理完整的 AI 流水线——无需手动进行 Docker 或 CLI 操作。它还增加了一个智能体层:提供持久化记忆、与摄像头的智能体对话、AI 视频生成、语音 (TTS),以及通过 Discord / Telegram / Slack 进行对话式消息推送。

📦 下载 SharpAI Aegis →


🗺️ 路线图

  • 技能架构 — 针对所有功能提供可插拔的 SKILL.md 接口
  • 技能商店 UI — 从 Aegis 浏览、安装和配置技能
  • AI/LLM 辅助技能安装 — 通过 AI 智能体安装并配置社区贡献的技能
  • 感知 GPU / NPU / CPU (AIPC) 的安装 — 自动检测硬件、安装匹配的框架,并将模型转换为最佳格式
  • 硬件环境层 — 共享 env_config.py,用于在 NVIDIA、AMD、Apple Silicon、Intel 和 CPU 上进行自动检测及模型优化
  • 技能开发 — 涵盖 10 个类别的 19 种技能,正随社区贡献积极扩展中

🧩 技能目录

每个技能都是一个独立的模块,拥有自己的模型、参数和通信协议。请参阅技能开发指南和平台参数以构建你自己的技能。

类别技能功能描述状态
检测yolo-detection-2026实时 80+ 类目标检测 — 通过 TensorRT / CoreML / OpenVINO / ONNX 自动加速✅
yolo-detection-2026-coral-tpuGoogle Coral Edge TPU — 通过 USB 加速器实现约 4ms 推理 (LiteRT)✅
yolo-detection-2026-openvinoIntel NCS2 USB / Intel GPU / CPU — 通过 OpenVINO 实现多设备支持 (架构)🧪
face-detection-recognition人脸检测与识别 — 从摄像头画面中识别已知人脸📐
license-plate-recognition车牌检测与识别 — 从摄像头画面中读取车牌号码📐
分析home-security-benchmark用于 LLM 和 VLM 安全性能的 143 项测试评估套件✅
隐私depth-estimation实时深度图隐私转换 — 在保留活动信息的同时对摄像头画面进行匿名化处理✅
分割sam2-segmentation基于 Segment Anything 2 的交互式点击分割 — 提供像素级掩码、点/框提示及视频跟踪功能✅
标注dataset-annotationAI 辅助数据集标注 — 自动检测、人工审核,并导出为 COCO/YOLO/VOC 格式以进行自定义模型训练📐
训练model-training智能体驱动的 YOLO 微调 — 标注、训练、导出、部署📐
自动化mqtt · webhook · ha-trigger基于事件的自动化触发器📐
集成homeassistant-bridgeHA 摄像头输入 ↔ 检测结果输出📐

✅ 已就绪 · 🧪 测试中 · 📐 计划中

注册表: 所有技能均在 skills.json 中进行索引,以便以编程方式发现。

检测与分割技能

检测与分割技能处理来自摄像头画面的视觉数据——进行目标检测、区域分割或场景分析。所有技能均使用相同的 JSONL stdin/stdout 协议:Aegis 将帧写入共享卷,通过 stdin 发送 frame 事件,并从 stdout 读取 detections。每个检测技能都是可互操作的。

贡献者
sclnyacrFI
项目信息
默认分支master
LicenseMIT License
创建时间2019/3/5
最近更新今天
GAI 中文摘要

DeepCamera 是一个开源的 AI 摄像头技能平台,旨在为传统安防监控系统赋予深度学习和多模态大模型分析能力。它通过在本地运行先进的视觉模型,帮助用户实现智能化视频监控,并在保障隐私的前提下提供强大的安防自动化功能。

支持利用 Qwen、DeepSeek 等视觉语言模型进行本地场景分析与视频理解。 集成人脸识别、目标检测、人员重识别及跌倒检测等多种核心安防算法。 提供基于大模型的智能代理功能,支持通过 Telegram、Discord 或 Slack 实时接收报警与交互。 采用插件化技能架构,支持根据硬件配置灵活部署多种 AI 功能模块。 支持在 Mac Mini、AI PC 等本地设备上部署,实现完全离线的智能化监控管理。

该项目非常适合关注隐私保护的家庭用户、小型企业,以及希望将现有监控系统升级为智能化、具备交互能力的智能安防系统的开发者和极客群体。