文章
149
标签
55
分类
40
首页
Drawio
AIdraw
Excalidraw
Markdown
时间线
标签
分类
关于
James的成长之路
搜索
首页
Drawio
AIdraw
Excalidraw
Markdown
时间线
标签
分类
关于
十月 2025
文章总览 - 32
2025
2025-10-15
读 ncnn 源码(Ⅸ):im2col+GEMM 原理与 `Mat::reshape(w,h,c)` 的对齐与 cstep
2025-10-15
读 ncnn 源码(Ⅷ):核心算法细讲——Activation 工厂、CPU 后端选择、im2col+GEMM 权重打包与分块
2025-10-14
读 ncnn 源码(Ⅶ):以卷积层为例——权重加载与 x86/FMA pipeline 选路
2025-10-13
读 ncnn 源码(Ⅵ):模型权重加载链路 —— DataReader / ModelBin / create_pipeline
2025-10-12
读 ncnn 源码(Ⅴ):Param 读取闭环——从 token 到图,再到 I/O 名单
2025-10-11
读 ncnn 源码(Ⅳ):Convolution 基类与 x86/FMA 特化 —— 参数到算子的全链路
2025-10-10
读 ncnn 源码(Ⅲ):ParamDict 解析、featmask 按层屏蔽、词法器与 blob 索引(含解析实录)
2025-10-10
读 ncnn 源码(Ⅱ):层工厂与“覆盖机制”,以及 CPU 端的指令集优选
2025-10-10
读 ncnn 源码(Ⅰ):从 sample 到 `Net::load_param` 的完整链路
2025-10-09
AI infra 合集
1
2
3
4
James He
#远离喧嚣 向野而生#
文章
149
标签
55
分类
40
Follow Me
公告
当你穿过了暴风雨,你就不再是原来的那个人了
充实每一天
最新文章
大模型分布式训练与推理中的通信原语:从基础到工程实践
2026-04-14
分布式训练网络全面解析:从 TCP/IP 到 NCCL
2026-04-13
Mooncake:以 KVCache 为中心的 LLM 推理解耦架构详解
2026-04-12
深入浅出 RDMA 编程:高性能网络技术全解析
2026-04-12
CUDA 生态与框架:从 cuBLAS 到多 GPU 训练
2026-03-31
分类
AI
2
AI Infra
102
CUDA
7
Mini-Infer
37
Mini-SGLang
9
Mooncake
1
NCCL
2
RDMA
1
标签
CUDA
AI Infra
FEM
C++
Docker
CMake
Tensorflow
keil
NCCL
Clash
群晖
Qt
力扣
github
群晖 服务器 git
Doxygen
Mini-SGLang
C/C++
字符串
Windows远程唤醒
MFC
编程素养
数据库
图床
git
数组
Python
Window Terminal
cloudflare
Linux
链表
BMC
ipmitool
C++11/14/17/20
计算电磁学
smms
《Modern C++ Tutorial》读书笔记
DeepSeek
数据结构与算法
Pytorch
归档
四月 2026
4
三月 2026
12
二月 2026
5
一月 2026
10
十二月 2025
12
十一月 2025
29
十月 2025
32
九月 2025
3
网站资讯
文章数目 :
149
已运行时间 :
本站总字数 :
357.3k
本站访客数 :
本站总访问量 :
最后更新时间 :
搜索
数据库加载中