
俱乐部开源实习课题任务书
-
课题名称:可信 Agent Skills 与 MCP Hub 平台设计与实现
-
指导导师:慕冬亮、陈磊
-
开发语言:TypeScript、Python
-
预计项目时长:120 小时 / 8 周
-
难度等级:中等偏高级
-
课题背景信息介绍:
随着 Claude Code、Cursor、OpenAI Agents SDK 等智能体工具快速发展,Agent Skills、MCP Server、Subagent、Prompt、Command 等能力单元正在成为智能体生态中的重要组成部分。开发者可以通过一个 Skill 让智能体掌握特定工作流,也可以通过 MCP Server 连接数据库、代码仓库、浏览器、企业系统等外部工具。类似 npm、PyPI、VS Code Marketplace 的分发生态正在形成,但智能体能力单元与传统软件包不同:它们不仅包含代码和依赖,还包含会直接影响模型行为的自然语言指令、工具权限和外部资源访问路径。
当前社区中已经出现 Skills / MCP 的公开目录、插件市场和命令行安装工具,用户可以通过 marketplace、GitHub 仓库或
npx命令发现并安装相关能力。然而,对于高校实验室、开源社区和企业内部场景而言,直接使用未经审核的 Skills 或 MCP 存在明显风险:恶意提示注入、危险脚本、凭据读取、供应链投毒、越权工具调用、版本漂移、来源不可追溯等问题都可能影响开发环境和业务数据安全。本课题旨在设计并实现一个面向 Agent Skills 与 MCP Server 的可信分发平台,类似内部版 Skill Hub。平台应支持用户浏览、搜索、提交、审核、评分、安装和更新可信 Skills / MCP;同时提供命令行工具,使用户能够通过
npx等方式快速拉取经过审核的能力包。平台需要建立一套内部审核机制和信任度评分模型,将自动化扫描、人工 Review、来源信誉、权限声明、版本签名、使用反馈等因素纳入可信评价,为智能体能力扩展提供可治理、可追溯、可落地的基础设施。
- 熟悉 TypeScript / Node.js,能够实现 Web 服务、前端页面和命令行工具
- 具备基本后端开发能力,了解 RESTful API、数据库建模、用户认证与权限控制
- 本课题允许并鼓励申请者合理使用 AI 编程工具辅助开发、调试和文档撰写,但申请者仍需具备前后端基础,能够拆解需求、审查 AI 生成代码、定位问题并完成工程集成
- 了解 Agent Skills、MCP、Claude Code 插件、智能体工具调用等基本概念,有学习相关生态规范的意愿
- 具备基本安全意识,了解供应链安全、权限控制、代码审查、敏感信息检测、提示注入等风险
- 熟悉 Git、Markdown、JSON / YAML 配置格式,能够设计清晰的元数据规范和开发文档
- 加分项:了解静态分析、CI/CD、包管理器、软件签名、SBOM、SemVer 或开源社区治理流程
- 调研 Claude Code 插件市场、Agent Skills、MCP Registry、社区 Skill Hub、GitHub 分发、
npx安装工具等现有方案 - 梳理可信 Skills / MCP Hub 需要支持的核心对象:Skill、MCP Server、Plugin、Subagent、Command、Prompt 等
- 明确平台角色与业务流程,至少包括普通用户、提交者、审核员、管理员三类角色
- 输出需求分析文档,覆盖浏览搜索、详情展示、提交审核、自动扫描、人工 Review、信任评分、CLI 安装、版本更新、下架与审计等流程
- 设计统一的能力包元数据格式,描述名称、版本、作者、来源仓库、许可证、适配客户端、安装方式、权限声明、依赖、入口文件、风险标签等信息
- 分别定义 Skill 与 MCP Server 的最小提交规范,例如
SKILL.md、.claude-plugin/plugin.json、MCP manifest、安装命令、配置模板等 - 支持多来源接入,包括 GitHub 仓库、npm 包、PyPI 包、Docker 镜像、本地压缩包或人工上传
- 输出规范文档和若干示例包,确保后续平台、审核系统和 CLI 工具能够基于统一元数据工作
- 设计并实现后端 API,支持能力包创建、版本管理、搜索过滤、详情查询、评分展示、审核流转和安装统计
- 建立数据库模型,至少包含用户、能力包、版本、审核记录、扫描报告、信任评分、安装记录、评论反馈等核心实体
- 实现认证与授权机制,区分提交者、审核员和管理员权限
- 提供可被 Web 前端和 CLI 工具调用的 API,并输出 OpenAPI 或接口文档
- 实现平台前端页面,支持用户浏览可信 Skills / MCP 列表,按类型、标签、适配客户端、评分、更新时间等条件筛选
- 实现能力包详情页,展示描述、版本、来源、安装命令、权限声明、审核状态、扫描结果、信任度评分和更新记录
- 实现提交与审核界面,支持提交者上传能力包,审核员查看 Diff、扫描报告、权限声明和风险提示,并给出通过、驳回、要求修改等结论
- 实现管理员视图,支持下架能力包、调整可信标签、查看审计日志和处理用户反馈
- 开发命令行工具,支持通过
npx方式运行,例如npx trusted-agent-hub search <keyword>、npx trusted-agent-hub install <name>、npx trusted-agent-hub update <name> - CLI 需要支持浏览、搜索、查看详情、安装、更新、卸载和校验能力包
- 根据目标客户端生成或写入对应配置,例如 Claude Code Skills 目录、Claude Code 插件目录、MCP 客户端配置文件等
- 安装前展示权限声明、信任度评分、审核状态和风险提示;对于低信任度或高权限能力包,需要显式确认
- 设计自动化审核流水线,对提交的 Skill / MCP 包进行结构校验、元数据校验、依赖检查、敏感信息检测和危险行为扫描
- 风险扫描至少覆盖:提示注入可疑指令、危险 shell 命令、网络外连、读取环境变量、硬编码密钥、远程代码下载、过宽文件系统访问、可疑 npm / pip 依赖等
- 设计信任度评分模型,综合来源可信度、作者信誉、审核结论、扫描结果、权限范围、版本稳定性、安装量、用户反馈等因素生成 0-100 分评分
- 输出评分解释,使用户能够理解扣分原因和主要风险,而不是只看到一个黑盒分数
- 构建一批示范 Skills / MCP 包,包含高可信样例、待人工确认样例和明确风险样例
- 编写单元测试和集成测试,覆盖提交、扫描、审核、发布、CLI 安装和下架流程
- 将平台部署到本地服务器或云环境,提供可访问的 Web 页面和可执行的 CLI 安装方式
- 输出测试报告、部署文档和用户使用手册,保证导师和社区成员能够独立体验完整流程
验收时间:本课题预计于领取后 8 周内开展课题验收,验收项如下所示:
- 代码:提交完整平台代码,包含后端 API、Web 前端、CLI 工具、扫描规则和信任评分模块;代码结构清晰,可通过 README 快速启动
- 平台:提供可访问的 Hub 页面,能够浏览、搜索、提交、审核、发布和下架 Skills / MCP
- CLI:提供可通过
npx运行的命令行工具,能够完成搜索、详情查看、安装、更新、卸载和校验流程 - 审核机制:实现自动扫描 + 人工 Review 的审核流,能够展示扫描报告、审核结论、审计记录和信任度评分解释
- 数据:提交不少于 10 个示范能力包,其中至少包含 Skill、MCP Server 和风险样例三类
- 文档:提交需求分析文档、元数据规范、接口文档、部署文档、用户使用手册、测试报告和安全设计说明
- 汇报:提交课题总结 PPT 或技术博客,说明平台架构、可信审核机制、评分模型、CLI 安装流程和后续扩展方向
- 展示:现场演示完整流程:提交一个 Skill / MCP 包,平台自动扫描并进入审核,审核通过后用户在 Web 端浏览,并通过
npxCLI 安装到本地智能体客户端
- Claude Code Skills 文档,https://code.claude.com/docs/en/skills
- Claude Code 插件市场与安装机制,https://code.claude.com/docs/en/discover-plugins
- Claude Code 插件创建与审核机制,https://code.claude.com/docs/en/plugins
- Claude Code 插件参考,https://code.claude.com/docs/en/plugins-reference
- MCP Registry,https://modelcontextprotocol.info/tools/registry/
- Anthropic Agent Skills 设计文章,https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
- OWASP Agentic Skills Top 10,https://owasp.org/www-project-agentic-skills-top-10/
- OWASP Top 10 for LLM Applications,https://owasp.org/www-project-top-10-for-large-language-model-applications/


