模型量化资料整理

模型量化资料整理

Scroll Down

模型量化学习资料整理

模型的量化是深度学习模型落地不可或缺的一环,如何在边缘端让模型在尽量保证精度的同时,变得更小更快是一个挺有意思的问题。这周打算集中学习一下,本篇文章先记录一下质量较高的学习资料。

nvidia int8 TRT量化 PPT

https://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf

对ppt的分析讲解:

https://zhuanlan.zhihu.com/p/58182172

https://zhuanlan.zhihu.com/p/58208691

github中的通用量化函数

https://github.com/aaron-xichen/pytorch-playground/blob/5d476295f1c1564c8074eb885bb6138d6bd09889/utee/quant.py

github的量化整合资料

https://github.com/Ewenwan/MVision/tree/master/CNN/Deep_Compression/quantization

NNIE量化白皮书

https://docs.xilinx.com/v/u/TpMl3oSNEeOPE8t3I5bpPQ

白皮书对应讲解

https://zhuanlan.zhihu.com/p/81243626
NNIE白皮书对底层原理的解释更加透彻