文章
所有发布的文章。
-
手绘风格的数据可视化
罗列常用手绘风格数据可视化工具及适用图表,包括 rough.js、draw.io、matplotlib xkcd、chart.xkcd 和 cutecharts。
-
深度学习模型大小与模型推理速度的探讨
探讨深度学习模型的参数量、计算量、访存量等指标对推理速度的影响,并给出针对不同硬件的网络设计建议。
-
图像局部区域(Patch)的描述符学习策略
综述基于学习的图像局部区域描述符(local descriptor)的数据处理与训练策略,关注不同论文在 patch 学习方向上的异同。
-
pybind: 为cpp/cuda代码提供python接口
通过 pybind11 为 C++/CUDA 代码提供 Python 绑定,实现 numpy/torch 张量与 Eigen/cv::Mat 的零拷贝转换。
-
Numba: 简单装饰器加速python代码
介绍如何通过 numba 库为 Python 函数添加装饰器的方式进行即时编译加速,简单易用、灵活高效。
-
通过NPP加速TensorRT部署时图片数据预处理
介绍如何通过 NVIDIA NPP 库加速 TensorRT 推理部署时的图片数据预处理(uint8→float32)过程。
-
Numba: 通过python快速学习cuda编程
通过 Python 的 numba 库快速上手 CUDA 多线程高并发编程,降低 CUDA 入门门槛。