标签: performance
包含标签的所有文章 "performance".
-
低维表示:投影降维、MRL 与稀疏表示
大规模检索系统里的 embedding 成本不只来自模型前向,也来自向量存储、内存带宽和 KNN 计算。这里比较投影降维、MRL 与 CSR 稀疏表示三种做法。
-
PyTorch 2.12 稀疏矩阵深度解析:COO、CSR、CSC、BSR 与 BSC
从 PyTorch 2.12 的 COO、CSR、CSC、BSR、BSC 数据结构出发,解释稀疏矩阵的存储方式、乘法路径,以及一组 CPU/GPU 实验里的存储和速度比例。