永远年轻
RSS Feed记录关于机器学习、CUDA、Python 及其他技术的思考与笔记。驱车向远方。
最新文章
-
低维表示:投影降维、MRL 与稀疏表示
大规模检索系统里的 embedding 成本不只来自模型前向,也来自向量存储、内存带宽和 KNN 计算。这里比较投影降维、MRL 与 CSR 稀疏表示三种做法。
-
PyTorch 2.12 稀疏矩阵深度解析:COO、CSR、CSC、BSR 与 BSC
从 PyTorch 2.12 的 COO、CSR、CSC、BSR、BSC 数据结构出发,解释稀疏矩阵的存储方式、乘法路径,以及一组 CPU/GPU 实验里的存储和速度比例。
-
当思考(CoT)遇见embedding
生产搜索系统在嵌入查询前会先用大语言模型对其进行改写。ICLR 2026 的两篇论文探究了当改写与嵌入共用同一模型(乃至同一梯度)时会发生什么。
-
手绘风格的数据可视化
罗列常用手绘风格数据可视化工具及适用图表,包括 rough.js、draw.io、matplotlib xkcd、chart.xkcd 和 cutecharts。
-
深度学习模型大小与模型推理速度的探讨
探讨深度学习模型的参数量、计算量、访存量等指标对推理速度的影响,并给出针对不同硬件的网络设计建议。