全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > 电子/半导体 > 嵌入式技术 >

YOLOv8模型ONNX格式INT8量化轻松搞定

时间:2023-07-18 09:34

人气:

作者:admin

标签: python  C++语言 

导读:深度学习模型量化支持深度学习模型部署框架支持的一种轻量化模型与加速模型推理的一种常用手段,ONNXRUNTIME支持模型的简化、量化等脚本操作,简单易学,非常实用。...

ONNX格式模型量化

深度学习模型量化支持深度学习模型部署框架支持的一种轻量化模型与加速模型推理的一种常用手段,ONNXRUNTIME支持模型的简化、量化等脚本操作,简单易学,非常实用。 ONNX 模型量化常见的量化方法有三种:动态量化、静态量化、感知训练量化,其中ONNXRUNTIME支持的动态量化机制非常简单有效,在保持模型精度基本不变的情况下可以有效减低模型的计算量,可以轻松实现INT8量化。

动态量化:此方法动态计算激活的量化参数(刻度和零点)。
静态量化:它利用校准数据来计算激活的量化参数。
量化感知训练量化:在训练时计算激活的量化参数,训练过程可以将激活控制在一定范围内。
当前ONNX支持的量化操作主要有:

e0acd6fc-24b2-11ee-962d-dac502259ad0.png

Opset版本最低不能低于10,低于10不支持,必须重新转化为大于opset>10的ONNX格式。模型量化与图结构优化有些是不能叠加运用的,模型开发者应该意识这点,选择适当的模型优化方法。 ONNXRUNTIME提供的模型量化接口有如下三个:

quantize_dynamic:动态量化
quantize_static:静态量化
quantize_qat:量化感知训练量化

FP16量化

首先需要安装好ONNX支持的FP16量化包,然后调用相关接口即可实现FP16量化与混合精度量化。安装FP16量化支持包命令行如下:

pip install onnx onnxconverter-common

实现FP16量化的代码如下:

e0c49292-24b2-11ee-962d-dac502259ad0.png

INT8量化

最简单的量化方式是动态量化与静态量化。选择感知训练量化机制,即可根据输入ONNX格式模型生成INT8量化模型,代码如下:

e0edb3f2-24b2-11ee-962d-dac502259ad0.png

案例说明

YOLOv8自定义模型ONNXINT8量化版本对象检测演示 以作者训练自定义YOLOv8模型为例,导出DM检测模型大小为,对比导出FP32版本与INT8版本模型大小,相关对比信息如下:

e10cf1ea-24b2-11ee-962d-dac502259ad0.png

使用FP32版本实现DM码检测,运行截图如下:

e13ad98e-24b2-11ee-962d-dac502259ad0.png

使用INT8版本实现DM码检测,运行截图如下:

e15759ec-24b2-11ee-962d-dac502259ad0.png

ONNXRUNTIME更多演示

YOLOv8对象检测 C++

e17efd08-24b2-11ee-962d-dac502259ad0.jpg

YOLOv8实例分割模型 C++ 推理:

e18e3cf0-24b2-11ee-962d-dac502259ad0.jpg

UNet语义分割模型 C++ 推理:

e19fa01c-24b2-11ee-962d-dac502259ad0.png

Mask-RCNN实例分割模型 C++ 推理:

e1b23d58-24b2-11ee-962d-dac502259ad0.png

YOLOv8姿态评估模型 C++ 推理:

e1da8510-24b2-11ee-962d-dac502259ad0.png

e217f3b4-24b2-11ee-962d-dac502259ad0.png

人脸关键点检测模型 C++ 推理:

e24c7eae-24b2-11ee-962d-dac502259ad0.png

人脸关键点检测模型 Python SDK 推理:

e28298ae-24b2-11ee-962d-dac502259ad0.png

学会用C++部署YOLOv5与YOLOv8对象检测,实例分割,姿态评估模型,TorchVision框架下支持的Faster-RCNN,RetinaNet对象检测、MaskRCNN实例分割、Deeplabv3 语义分割模型等主流深度学习模型导出ONNX与C++推理部署,轻松解决Torchvision框架下模型训练到部署落地难题。





审核编辑:刘清

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信