文章
149
标签
55
分类
40
首页
Drawio
AIdraw
Excalidraw
Markdown
时间线
标签
分类
关于
James的成长之路
搜索
首页
Drawio
AIdraw
Excalidraw
Markdown
时间线
标签
分类
关于
Mini-Infer
分类 - Mini-Infer
2025
2025-12-18
Mini-Infer (25): 动态形状的基石 — `OptimizationProfile` 设计与实现
2025-12-18
Mini-Infer (24): 动态形状支持 — 运行时形状推理引擎
2025-12-18
Mini-Infer (23): 内存优化的黑魔法 — 静态内存规划与贪心着色
2025-12-18
Mini-Infer (22): 架构重构 — 链接器的魔法与“副作用”驱动的自动注册
2025-12-09
Mini-Infer (21): 图优化实战 — TensorRT 风格的 `FusionPass` 与延迟删除
2025-12-09
Mini-Infer (20): 优化器的骨架 — `Pass Manager` 架构设计
2025-12-03
Mini-Infer (19): 内置算子导入实战 — Conv, ReLU, Pooling 与 Flatten
2025-12-03
Mini-Infer (18): 编排导入流程 — `ModelImporter` 与 `AttributeHelper`
2025-12-03
Mini-Infer (17): 深入字节流 — `WeightImporter` 与权重加载
2025-12-03
Mini-Infer (16): 模型导入的核心 — `ImporterContext` 与 `OperatorRegistry`
1
2
3
4
James He
#远离喧嚣 向野而生#
文章
149
标签
55
分类
40
Follow Me
公告
当你穿过了暴风雨,你就不再是原来的那个人了
充实每一天
最新文章
大模型分布式训练与推理中的通信原语:从基础到工程实践
2026-04-14
分布式训练网络全面解析:从 TCP/IP 到 NCCL
2026-04-13
Mooncake:以 KVCache 为中心的 LLM 推理解耦架构详解
2026-04-12
深入浅出 RDMA 编程:高性能网络技术全解析
2026-04-12
CUDA 生态与框架:从 cuBLAS 到多 GPU 训练
2026-03-31
分类
AI
2
AI Infra
102
CUDA
7
Mini-Infer
37
Mini-SGLang
9
Mooncake
1
NCCL
2
RDMA
1
标签
CUDA
AI Infra
FEM
C++
Docker
CMake
Tensorflow
keil
NCCL
Clash
群晖
Qt
力扣
github
群晖 服务器 git
Doxygen
Mini-SGLang
C/C++
字符串
Windows远程唤醒
MFC
编程素养
数据库
图床
git
数组
Python
Window Terminal
cloudflare
Linux
链表
BMC
ipmitool
C++11/14/17/20
计算电磁学
smms
《Modern C++ Tutorial》读书笔记
DeepSeek
数据结构与算法
Pytorch
归档
四月 2026
4
三月 2026
12
二月 2026
5
一月 2026
10
十二月 2025
12
十一月 2025
29
十月 2025
32
九月 2025
3
网站资讯
文章数目 :
149
已运行时间 :
本站总字数 :
357.3k
本站访客数 :
本站总访问量 :
最后更新时间 :
搜索
数据库加载中