标签: embeddings
包含标签的所有文章 "embeddings".
-
低维表示:投影降维、MRL 与稀疏表示
大规模检索系统里的 embedding 成本不只来自模型前向,也来自向量存储、内存带宽和 KNN 计算。这里比较投影降维、MRL 与 CSR 稀疏表示三种做法。
-
当思考(CoT)遇见embedding
生产搜索系统在嵌入查询前会先用大语言模型对其进行改写。ICLR 2026 的两篇论文探究了当改写与嵌入共用同一模型(乃至同一梯度)时会发生什么。
包含标签的所有文章 "embeddings".
大规模检索系统里的 embedding 成本不只来自模型前向,也来自向量存储、内存带宽和 KNN 计算。这里比较投影降维、MRL 与 CSR 稀疏表示三种做法。
生产搜索系统在嵌入查询前会先用大语言模型对其进行改写。ICLR 2026 的两篇论文探究了当改写与嵌入共用同一模型(乃至同一梯度)时会发生什么。