Mini-Infer (35): 插件架构实战 — 从旧架构到新架构的迁移
Mini-Infer (34): 插件架构 (下) — PluginRegistry 与自动注册
Mini-Infer (33): 插件架构 (中) — CRTP 基类与静态多态
Mini-Infer (32): 插件架构 (上) — IPlugin 接口设计
Mini-Infer (31): CUDA 后端支持 (下) — TensorRT 风格权重预加载
Mini-Infer (30): CUDA 后端支持 (中) — CUDADeviceContext 与异构执行环境
Mini-Infer (29): CUDA 后端支持 (上) — CUDAAllocator 与显存管理
Mini-Infer (28): Core 数据结构优化 — Storage 与 Tensor 分离
Mini-Infer (27): 运行时架构重构 (下) — ExecutionContext 与零拷贝执行
Mini-Infer (26): 运行时架构重构 (上) — InferencePlan 与 Build-Time 优化
Mini-Infer (25): 动态形状的基石 — `OptimizationProfile` 设计与实现
Mini-Infer (24): 动态形状支持 — 运行时形状推理引擎
Mini-Infer (23): 内存优化的黑魔法 — 静态内存规划与贪心着色
Mini-Infer (22): 架构重构 — 链接器的魔法与“副作用”驱动的自动注册
Mini-Infer (21): 图优化实战 — TensorRT 风格的 `FusionPass` 与延迟删除
Mini-Infer (20): 优化器的骨架 — `Pass Manager` 架构设计
avatar
James He
#远离喧嚣 向野而生#
Follow Me
公告
当你穿过了暴风雨,你就不再是原来的那个人了
充实每一天