俱乐部开源实习课题任务书

Yinchunyuan

2026-06-09 发布110 浏览 · 0 点赞 · 0 收藏

一、课题基本信息

课题名称：基于 LLM 与代码分析的 OpenHarmony 智能漏洞检测工具
指导导师：慕冬亮
开发语言：Python（核心引擎），C/C++（测试用例与目标分析对象）
预计项目时长：88 小时 / 6 周
难度等级：高级
课题背景信息介绍： OpenHarmony（鸿蒙开源版）是一个面向全场景的分布式操作系统，代码量庞大且持续增长。由于系统内核、驱动框架、多媒体框架等底层模块大量使用 C/C++ 编写，内存安全漏洞（如缓冲区溢出、UAF、双重释放等）是影响系统安全性的主要威胁之一。传统的静态分析工具（如 Coverity、CodeQL）在检测 OpenHarmony 特有安全边界（Parcel IPC、NAPI 跨语言调用、Ability Token 校验）方面覆盖不足，需要大量领域特定的规则定制。

本课题旨在构建一个结合大语言模型（LLM）推理能力与传统静态分析技术（AST 解析、数据流追踪、调用图构建） 的混合式漏洞检测工具，专门针对 OpenHarmony 生态进行优化。工具采用多 Agent 架构（分析 Agent + 验证 Agent），通过两阶段辩论机制降低误报率，并集成鸿蒙专属检测规则与跨函数过程间分析引擎，实现对常见内存安全漏洞（堆溢出、越界读、UAF、双重释放、内存泄漏、空指针等）及鸿蒙特有安全边界漏洞（Token 验证、类型混淆、未受信任指针等）的全覆盖检测。

设计并实现 LLM 客户端模块，支持多 Agent 协作分析（如分析 Agent + 验证 Agent 的双阶段架构），鼓励探索降低误报率的 Agent 交互策略
实现代码语义分块与批量文件扫描能力，支持断点续扫，提升大规模代码库扫描效率
设计合理的 Prompt 策略（如思维链推理），引导 LLM 完成从漏洞线索发现到确认的分析链路

搭建 DAYU200（RK3568）开发板验证环境，包括设备连接（hdc）、系统版本确认与日志取证链路（hilog、faultlog、dmesg）
建立从静态分析告警到真机复现的自动化工作流，支持两条验证路径：应用侧 HAP 验证（DevEco Studio 签名部署）与源码侧 Native/系统组件验证（交叉编译 + hdc 推送）
实现告警分诊与版本匹配流程：从大量静态分析报告中筛选高价值告警，核对告警文件与目标函数在当前设备版本中的可达性，标记版本漂移
探索在 DAYU200 上运行 Native PoC 的环境适配问题（如 musl libc 兼容性、裸 syscall 方案），形成可复用的设备端验证模板
收集复现证据并输出结论（真阳性 / 未证实 / 未能复现），形成闭环反馈，反哺工具检测规则的优化

验收时间：本课题预计于领取后 2-3 月内开展课题验收，验收项如下所示：

请前往登录/注册即可发表您的看法…