培训对象:嵌入式工程师、边缘计算开发人员、AI应用开发者、需要将视觉算法部署到边缘设备的硬件软件开发人员。
培训目标:
掌握Jetson平台/RK3588的软硬件架构,完成开发环境搭建与系统烧录。
熟练进行OpenCV的交叉编译与优化,实现图像采集、预处理、显示的全流程。
掌握TensorRT/NCNN推理引擎的使用,能够将深度学习模型部署到边缘设备,实现实时目标检测。
培训内容介绍:
嵌入式平台选型:对比Jetson Nano/TX2/Xavier/Orin与瑞芯微RK3588的性能参数,根据项目需求选择合适平台。
系统烧录与基础配置:下载SDK Manager或官方固件,烧录系统镜像,配置SSH远程访问、VNC远程桌面。
开发环境搭建:安装CUDA、cuDNN、TensorRT(Jetson)或RKNN SDK(RK3588),配置Python/C++开发环境。
摄像头接入:连接USB摄像头、MIPI CSI摄像头,使用GStreamer或V4L2采集图像,设置分辨率与帧率。
OpenCV交叉编译与优化:针对ARM架构编译OpenCV,启用NEON优化、VFP支持,实现硬件加速的图像处理。
图像预处理与显示:编写程序采集图像,进行缩放、色彩空间转换、归一化等预处理,通过HDMI或网络显示结果。
多线程优化:使用生产者-消费者模型分离图像采集与处理线程,使用环形缓冲区减少延迟,提高吞吐量。
硬件编解码:使用NVIDIA的NVDEC/NVENC或RK3588的MPP硬件编解码单元,实现视频的实时编码与解码。
TensorRT加速推理:将训练好的模型转换为TensorRT引擎,设置工作空间,进行FP16/INT8量化,优化推理速度。
NCNN部署(RK3588):将模型转换为NCNN格式,利用RK3588的NPU进行推理加速,实现低功耗目标检测。
项目一:边缘AI盒子:开发一个边缘AI推理设备,通过RTSP拉流,实时运行YOLO目标检测,将结果通过MQTT上报。
项目二:智能相机:将摄像头与边缘计算模块集成,实现本地实时检测,通过显示屏或指示灯输出检测结果。