Projects
按交付方式分类,独立完成与AI 协作分开展示。所有项目源码均可在我的 GitHub 查看。
独立完成(课程项目)
SysY 编译器
C++ · Flex/Bison · RISC-V · QEMU · 2024.03 – 2024.06
基于 C++ 独立实现 SysY(C 语言子集)到 RISC-V 汇编的完整编译流水线,覆盖词法/语法分析、语义检查、Koopa IR 生成、指令选择与寄存器分配全流程。设计递归下降语法树与栈式符号表管理多层作用域;逐步支持表达式、控制流、函数调用、多维数组等语言特性。生成代码在 QEMU 上通过全部测试用例。
xv6 OS Lab
C · RISC-V · GDB · QEMU · 2023.10 – 2023.12
独立完成 MIT xv6 内核实验,涵盖系统调用添加、进程调度优化、多级页表映射、内核锁与并发同步、文件系统扩展等核心模块。使用 GDB 跟踪系统调用链路与缺页异常流程,定位并修复内核态并发与内存管理问题。
(课程项目,源码暂未公开)
近期项目(AI 协作交付)
以下项目在 Claude Code 等 AI 编码工具协作下完成。我负责需求拆解、架构决策、调试与部署。
TinyLlama 推理引擎
C++ · CUDA · CMake · cuBLAS · 2026.04
从零实现 GEMM/RMSNorm/Softmax/Transpose/RoPE 等 CUDA kernel,应用 warp shuffle、online softmax、shared memory tiling、register cache 等优化。Transpose 达 2.81× 加速(125→351 GB/s),GEMM 达 cuBLAS 89.8% 性能。实现 Flash Attention v1 fused kernel 替代朴素三 kernel 注意力,结合 GQA 压缩 KV cache 显存。
订单库存管理系统
FastAPI · PostgreSQL · Redis · Celery · Vue 3 · Docker · 2026.03
FastAPI + SQLAlchemy 三层后端:行锁 + idempotency_key 唯一约束实现幂等防超卖,取消订单走 Saga 补偿事务避免死锁;Redis Cache-Aside + Celery 延迟任务处理超时关单;structlog + trace_id 与 Prometheus 可观测性;C++ gRPC 库存微服务 + Python CircuitBreaker 熔断 fallback。pytest 59 用例覆盖率 80%+,Locust 50 并发下单 P95 140ms。
多智能体 RAG 问答系统
Python · CrewAI · ChromaDB · DeepSeek/Qwen · Streamlit · Docker · 2026.02
基于 CrewAI 编排 Router/Retriever/Responder 三 Agent 顺序协作 pipeline:Router 先判定意图分流向量检索或直答。PyMuPDF 处理多格式文档上传,递归字符切片 + 阿里 text-embedding-v3 向量化,ChromaDB 持久化。单一 .env 适配 DeepSeek/Qwen/OpenAI 多 Provider。
三维医学图像配准改进
Python · PyTorch · 算法研究 · 2026.01 – 至今
提出频率感知卷积(FAConv)用于三维可变形医学图像配准:通过 3D FFT 计算体素低频/高频重建能量并做确定性二分区,为不同频域特性区域独立生成动态卷积核,替代原有 K-Means 聚类方案消除分区随机性。在 IXI 脑 MRI、LPBA40 及腹部 CT 三数据集上验证。
(研究进行中,源码暂未公开)
运维 / 工程
本站 xsdev.top
Astro · Caddy · Docker · Cloudflare · Let's Encrypt
本博客完整部署链路:RackNerd VPS + Ubuntu + Docker Compose + Caddy(自动 HTTPS)+ Cloudflare DNS + NameSilo 域名。自建过程中处理了 DuckDNS NS 解析异常、ACME 证书签发、反向代理共存等问题。前端使用 AstroPaper 模板基础上定制。
Claude Code 中文上手指南
文档 · 技术写作
面向中国用户的 Claude Code 中文全面上手指南,基于原版本土化重写,保留命令与配置兼容性,附学习路径与本地化校验护栏。