raga-ai-hub/RagaAI-Catalyst

Python SDK for Agent AI Observability, Monitoring and Evaluation Framework. Includes features like agent, llm and tools tracing, debugging multi-agentic system, self-hosted dashboard and advanced analytics with timeline and execution graph view

agentic-aiagentic-ai-developmentagentneoagentsai-agent-monitoringai-application-debuggingai-evaluation-toolsai-performance-optimizationai-tool-interaction-monitoringllm-testingllm-tracingllmops

GAI 中文摘要

RagaAI-Catalyst 是一个专为大模型（LLM）与智能体（Agent）开发设计的 Python 观测、监控与评估平台。它通过提供从追踪调试到安全性保障的一站式工具链，帮助开发者有效提升复杂 AI 应用的性能与稳定性。

核心功能包括：实现对 LLM 调用、工具使用以及多智能体交互过程的深度追踪与可视化分析。支持数据集管理、自动化评估与合成数据生成，助力开发者更高效地进行模型测试与优化。提供提示词管理与内置安全防护机制，确保生产环境中 AI 应用的合规性与质量。支持通过执行图与时间轴视图进行复杂系统调试，帮助定位智能体行为中的潜在逻辑故障。

该项目适用于从事 LLM 应用开发、AI 智能体构建以及 MLOps 的工程团队。特别适合需要对生产级复杂 AI 工作流进行深度监控、性能评估和安全红队测试的研发场景。

⭐

16.2k

Stars

🔱

3.6k

Forks

👁

Watchers

📋

Issues

PythonApache-2.0创建于 2024/8/26更新于今天

在 GitHub 上查看访问主页

README

由 Gemini 翻译整理

RagaAI Catalyst

RagaAI Catalyst 是一个综合性平台，旨在增强 LLM（大语言模型）项目的管理与优化。它提供了丰富的功能，包括项目管理、数据集管理、评估管理、Trace 管理、Prompt 管理、合成数据生成以及护栏（Guardrail）管理。这些功能使您能够高效地评估并保护您的 LLM 应用。

安装

您可以使用 pip 安装 RagaAI Catalyst：

pip install ragaai-catalyst

配置

在使用 RagaAI Catalyst 之前，您需要设置凭证。您可以通过设置环境变量或直接将其传递给 RagaAICatalyst 类来完成：

from ragaai_catalyst import RagaAICatalyst

catalyst = RagaAICatalyst(
    access_key="YOUR_ACCESS_KEY",
    secret_key="YOUR_SECRET_KEY",
    base_url="BASE_URL"
)

您需要生成身份验证凭证：

导航到您的个人资料设置（Profile Settings）
选择“Authenticate”
点击“Generate New Key”以创建您的 access key 和 secret key

如何生成身份验证密钥

注意：执行以下任何操作前，必须先完成 RagaAICatalyst 的身份验证。

使用指南

项目管理

使用 RagaAI Catalyst 创建和管理项目：

# 创建项目
project = catalyst.create_project(
    project_name="Test-RAG-App-1",
    usecase="Chatbot"
)

# 获取项目用例
catalyst.project_use_cases()

# 列出项目
projects = catalyst.list_projects()
print(projects)

数据集管理

为您的项目高效管理数据集：

from ragaai_catalyst import Dataset

# 为特定项目初始化数据集管理
dataset_manager = Dataset(project_name="project_name")

# 列出现有数据集
datasets = dataset_manager.list_datasets()
print("Existing Datasets:", datasets)

# 从 CSV 创建数据集
dataset_manager.create_from_csv(
    csv_path='path/to/your.csv',
    dataset_name='MyDataset',
    schema_mapping={'column1': 'schema_element1', 'column2': 'schema_element2'}
)

# 获取项目 Schema 映射
dataset_manager.get_schema_mapping()

数据集

有关数据集管理的详细信息（包括 CSV Schema 处理和高级用法），请参阅数据集管理文档。

评估管理

创建并管理 RAG 应用的指标评估：

from ragaai_catalyst import Evaluation

# 创建实验
evaluation = Evaluation(
    project_name="Test-RAG-App-1",
    dataset_name="MyDataset",
)

# 获取可用指标列表
evaluation.list_metrics()

# 为实验添加指标
schema_mapping={
    'Query': 'prompt',
    'response': 'response',
    'Context': 'context',
    'expectedResponse': 'expected_response'
}

# 添加单个指标
evaluation.add_metrics(
    metrics=[
      {"name": "Faithfulness", "config": {"model": "gpt-4o-mini", "provider": "openai", "threshold": {"gte": 0.232323}}, "column_name": "Faithfulness_v1", "schema_mapping": schema_mapping},
    
    ]
)

# 添加多个指标
evaluation.add_metrics(
    metrics=[
        {"name": "Faithfulness", "config": {"model": "gpt-4o-mini", "provider": "openai", "threshold": {"gte": 0.323}}, "column_name": "Faithfulness_gte", "schema_mapping": schema_mapping},
        {"name": "Hallucination", "config": {"model": "gpt-4o-mini", "provider": "openai", "threshold": {"lte": 0.323}}, "column_name": "Hallucination_lte", "schema_mapping": schema_mapping},
        {"name": "Hallucination", "config": {"model": "gpt-4o-mini", "provider": "openai", "threshold": {"eq": 0.323}}, "column_name": "Hallucination_eq", "schema_mapping": schema_mapping},
    ]
)

# 获取实验状态
status = evaluation.get_status()
print("Experiment Status:", status)

# 获取实验结果
results = evaluation.get_results()
print("Experiment Results:", results)

# 为新数据追加指标
# 如果您已向数据集添加新行，则可以重新计算指标