模型量化学习资料整理
模型的量化是深度学习模型落地不可或缺的一环,如何在边缘端让模型在尽量保证精度的同时,变得更小更快是一个挺有意思的问题。这周打算集中学习一下,本篇文章先记录一下质量较高的学习资料。
nvidia int8 TRT量化 PPT
https://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf
对ppt的分析讲解:
https://zhuanlan.zhihu.com/p/58182172
https://zhuanlan.zhihu.com/p/58208691
github中的通用量化函数
github的量化整合资料
https://github.com/Ewenwan/MVision/tree/master/CNN/Deep_Compression/quantization
NNIE量化白皮书
https://docs.xilinx.com/v/u/TpMl3oSNEeOPE8t3I5bpPQ
白皮书对应讲解
https://zhuanlan.zhihu.com/p/81243626
NNIE白皮书对底层原理的解释更加透彻