Projects
以下项目覆盖分布式系统、数据库与缓存、LLM 推理、编译器工具链和机器学习框架。项目描述侧重架构设计、核心实现、性能指标和测试结果,完整源码见我的 GitHub。
核心项目
go-raft-kv 分布式 KV 服务
Go · Raft · gRPC · WAL · Docker · 2026.05
3 节点 Raft KV 服务,覆盖 leader election、log replication、leader-only writes、CAS、leader redirect 与线性一致 leader read。对外提供 gRPC API 与 kvctl CLI,Docker Compose 可一键启动多节点集群。
持久化侧实现 WAL、snapshot compaction、InstallSnapshot 和节点重启恢复;测试覆盖 leader failover、follower catch-up、单节点故障仍可写、WAL recovery 与 race safety。
TinyLlama 推理引擎
C++ · CUDA · CMake · cuBLAS · 2026.04
TinyLlama-1.1B 单卡推理路径,覆盖 tokenizer、KV Cache、RMSNorm、RoPE、Softmax、INT8 GEMV、Top-K/Top-P sampler 与 cuBLAS GEMM 封装。核心关注点是”一个 token 如何经过推理主循环生成下一个 token”。
RTX 3080 Laptop 上 FP16 解码 91.5 tok/s、TTFT 24.2ms、峰值显存 7095MB;手写 Transpose / RMSNorm / GEMM 算子分别达到 2.81×、1.40× 和 cuBLAS 89.8% 性能。
TensorSysY 张量编译器
C++ · Flex/Bison · HIR/LIR · CUDA · CMake · 2026.04
在 SysY 编译器基础上扩展 first-class tensor 类型与 matmul / add / softmax / rmsnorm 等内建算子,打通 AST → HIR → LIR → C++/CUDA codegen → runtime adapter 的端到端编译流水线。
实现 shape/type verifier、const-fold、DCE、layout lowering、CUDA scheduling 与 LIR interpreter;通过 adapter 对接 mini-llm-engine 的 CPU/CUDA 算子库。本地 CPU+CUDA 32/32 ctest 通过,1024³ matmul benchmark gate 用于性能回归检查。
订单库存管理系统
FastAPI · PostgreSQL · Redis · Celery · C++ gRPC · Docker · 2026.03
FastAPI + SQLAlchemy 三层后端,基于 PostgreSQL SELECT FOR UPDATE 行锁和 idempotency_key 唯一约束实现幂等防超卖;取消订单走 Saga 补偿事务释放库存。
实现 Transactional Outbox:事务内写 orders / inventory / outbox_events,publisher 用 FOR UPDATE SKIP LOCKED 扫描,consumer 通过 processed_events 去重;支持指数退避、DLQ、重放、Prometheus 指标和 C++ gRPC 库存服务。Locust 50 并发下单 P95 140ms。
mini-redis-rs 缓存服务器
Rust · Tokio · RESP2 · TTL · AOF · 2026.05
从零实现 Redis 兼容缓存服务,支持 RESP2 流式解析、String/List/Hash/TTL/PubSub/INFO/BGREWRITEAOF;Tokio 每连接协程 + 分片状态支撑并发读写。
AOF 写入在响应前完成,支持 always / everysec / no 三种 fsync 策略;BGREWRITEAOF 使用一致性快照、rewrite buffer 和 atomic rename,96 个集成测试覆盖协议、过期、恢复和 compaction。
toydb SQL 数据库引擎
Rust · SQL · WAL · Index · REPL · 2026.05
实现手写 lexer/parser、SQL AST、执行器和 REPL,支持 DDL/DML、JOIN、GROUP BY/HAVING、聚合、scalar subquery、UNION、CASE WHEN 和 SQL 三值逻辑。
存储侧实现 8 KiB slotted page、pager cache、WAL replay、snapshot-style transaction、CREATE INDEX 与 equality IndexScan;约 275 个测试覆盖 parser/executor/storage/WAL/index。
nanograd 深度学习框架
Python · NumPy · Autograd · Neural Networks · 2026.05
纯 Python/NumPy 深度学习框架,核心包括动态 autograd、broadcasting-aware backward、Tensor ops、Conv2d、RNN/LSTM/GRU、Attention、ViT、UNet 和 ResNet。
实现优化器、LR scheduler、DataLoader、Trainer、gradcheck、checkpoint 和 elementwise fusion;316 个 fast tests 约 6s 通过,MNIST MLP 97.39%、CNN 98.25%、ViT 95.9%。
多智能体 RAG 问答系统
Python · CrewAI · ChromaDB · DeepSeek/Qwen · Streamlit · Docker · 2026.02
基于 CrewAI 编排 Router/Retriever/Responder 三 Agent pipeline,Router 判断 RETRIEVE / DIRECT 分支,减少无效向量检索并支持多轮 Memory。
PyMuPDF 处理 PDF/TXT/Markdown,递归字符切片 500/100 + text-embedding-v3 向量化;ChromaDB 持久化,DeepSeek/Qwen/OpenAI/Ollama 多 Provider 可配置切换。
三维医学图像配准动态卷积改进
Python · PyTorch · 3D Registration · 2026.01 – 至今
提出频率感知卷积 FAConv:通过 3D FFT 计算体素低频/高频重建能量并做确定性二分区,为不同频域区域生成动态卷积核,替代 K-Means 随机分区。
引入 lp_ratio 控制低通截止频率,支持解码器四个尺度独立配置;使用 fftfreq 修复 DC 分量偏移,在 IXI、LPBA40 与腹部 CT 数据集上验证。
(研究进行中,源码暂未公开)
其他项目
SysY 编译器
C++ · Flex/Bison · RISC-V · QEMU · 2024.03 – 2024.06
课程项目:基于 C++ 实现 SysY(C 语言子集)到 RISC-V 汇编的完整编译流水线,覆盖词法/语法分析、语义检查、Koopa IR 生成、指令选择与寄存器分配,生成代码在 QEMU 上通过测试用例。
xv6 OS Lab
C · RISC-V · GDB · QEMU · 2023.10 – 2023.12
课程项目:完成 MIT xv6 内核实验,涵盖系统调用添加、进程调度优化、多级页表映射、内核锁与并发同步、文件系统扩展等核心模块。
(课程项目,源码暂未公开)
macos-mcp MCP 服务器
Bun · TypeScript · Swift · JXA · Vision · MCP · 2026.04
给 LLM agent 暴露 macOS 原生能力的 stdio MCP 服务器,包括 Spotlight、Shortcuts、Calendar/Reminders、screencapture、Apple Vision OCR、浏览器标签和 Mail 搜索。做过 stdio-only、零网络暴露、输出路径白名单、OCR 大小限制等安全边界检查。
rlox — Crafting Interpreters 双实现
Rust · Cargo workspace · 编译器与解释器 · 2026.04
Rust 实现 Lox tree-walking interpreter 和 bytecode VM,共用测试 runner 驱动官方 .lox 脚本,重点练习 parser、resolver、闭包、类、继承、Pratt compiler 和栈式 VM。
Ray Tracing in One Weekend 三部曲
C++17 · CMake · std::thread · BVH · Monte Carlo · 2026.04
实现 Peter Shirley 三部曲渲染器,覆盖材质、相机、BVH、Perlin 噪声、Cornell Box、体积介质、重要性采样、三角形求交和 OBJ 加载。
本站 xsdev.top
Astro · Caddy · Docker · Cloudflare · Let's Encrypt
本站部署在 RackNerd VPS 上,使用 AstroPaper 静态站点、Caddy 自动 HTTPS、Cloudflare DNS 和 Docker Compose。自建过程中处理了域名解析、证书签发、静态站点与 ClipCascade 反向代理共存等问题。