全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > 电子/半导体 > 嵌入式技术 >

香橙派发布OrangePi AIpro(20T)本地部署Deepseek-R1蒸

时间:2025-02-14 16:29

人气:

作者:admin

标签: 香橙  开发板  DeepSeek  大模型 

导读:日前,香橙派官方发布OrangePiAIpro(20T)运行Deepseek-R1蒸馏模型实操指南,帮助用户通过先进算力和硬件架构实现高效的端侧智能。OrangePiAIpro(20T)是香橙派联合昇腾AI打造的高算力开发...

日前,香橙派官方发布OrangePi AIpro(20T)运行Deepseek-R1蒸馏模型实操指南,帮助用户通过先进算力和硬件架构实现高效的端侧智能

OrangePi AIpro(20T)是香橙派联合昇腾AI打造的高算力开发板,根植于昇腾AI技术,集AI计算、ISP、图形输出等功能于一体,释放高达20 TOPS的AI算力。可配24GB运行内存,汇聚了MIPI DSI、双MIPI CSIUSB3.0、Type-C、双HDMI2.0、双2.5G以太网、支持SATA/NVMe SSD 2280的M.2插槽等各类流行的接口。 OrangePi AIpro(20T)依托昇腾AI基础软硬件能力的基础,融合大模型与训推一体化优势,实现端边云全场景无缝部署,是构建昇腾计算产品、使能上层软件和应用的底座,有高算力、高能效等特性。

wKgZO2etV3SAEgasAAsLCfD-ZYA813.png

该产品广泛应用于AI边缘计算、深度视觉与视频流分析、自然语言处理、智能机器人(如小车、机械臂)、无人机云计算、AR/VR、智能安防及家居等AIoT全领域,引领行业智能化转型。

基于昇腾硬件底座、昇腾异构计算架构CANN、昇思Mindspore AI框架以及MindlE推理引擎,用户可以通过OrangePi Alpro(20T)开展面向金融、教育、政务、智能制造、智能家居、智慧交通等行业的人工智能应用开发。

OrangePi AIpro(20T)运行Deepseek-R1蒸馏模型

据了解,DeepSeek-R1专为数学、代码生成和复杂逻辑推理任务设计,通过大规模强化学习(RL)提升推理能力,还摒弃监督微调(SFT),采用纯强化学习(GRPO算法)训练基座模型。同时,DeepSeek-R1提供了高效模型蒸馏技术,可将大规模模型能力迁移至更小、更高效的版本,优化模型性能、开源应用。经蒸馏后的DeepSeek-R1模型支持部署于端侧,大幅降低计算资源需求,显著提升端侧设备的AI推理效率。

除OrangePi AIpro(20T)之外,迅龙软件也发布了OrangePi AI Studio、OrangePi 5Plus运行Deepseek-R1蒸馏模型的实操指南。迅龙软件表示,未来将继续加大研发投入,携手行业伙伴,推动不同算力等级的开发板与DeepSeek等优质模型相结合,进一步降低端侧AI的门槛,为客户创造更大的AI价值。

实操指南

DeepSeek-R1-Distill-Qwen-1.5B

  1. 下载最新的desktop版本镜像。

  1. 执行以下命令启动推理。

(base) HwHiAiUser@orangepiaipro-20t:~$cd orange-pi-mindspore/Online/17-DeepSeek-R1-Distill-Qwen-1.5B

(base) HwHiAiUser@orangepiaipro-20t:~/orange-pi-mindspore/Online/17-DeepSeek-R1-Distill-Qwen-1.5B$python deepseek-r1-distill-qwen-1.5b.py

  1. 第一次启动会自动下载模型,具体时间视网络环境而定,模型会被下载到“~/orange-pi-mindspore/Online/17-DeepSeek-R1-Distill-Qwen-1.5B/.mindnlp/model/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B/”文件夹内。

  1. 推理代码默认在启动的时候会检查相关的依赖,此时如果网络环境不好,会导致无法启动。如果不是第一次启动,且模型已经下载完成,可以按照下图所示,修改tokenizer和model参数,将路径改成本地绝对路径,这样就可以离线启动了。

(base) HwHiAiUser@orangepiaipro-20t:~/orange-pi-mindspore/Online/17-DeepSeek-R1-Distill-Qwen-1.5B$vimdeepseek-r1-distill-qwen-1.5b.py

  1. 等待一会,会出现一个ip,复制到开发板上的浏览器的地址栏访问。
wKgZO2eu_riAMo-5AALmjgCYz_8327.png

  1. 启动后,可在页面下方消息输入框“Type a message…”中输入任何问题,或者点击下方Examples中设置好的问题,然后点击右侧的“Submit”按钮,Qwen模型将对此进行回答。
wKgZO2eu_riAEK9HAACaMLKjOkI548.png

  1. 第一次回答需要较长时间加载,大约需要1分钟,请耐心等待。回答将显示在上方聊天框中。

  1. 如果出现Error,可以点击“retry”按钮重新发送上一条消息,并让模型重新回答;点击“undo”按钮可撤回上一条消息;点击“clear”按钮将清空聊天框中的对话。
wKgZPGeu_riANdCdAABq4V532AY458.png

  1. 输出结果如下图所示:
wKgZO2eu_riAPr1bAAflL91S5kY590.png
温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信