雷军多次参与小米YU7路测:舒适性给我留下深刻印象!
小米创办人雷军发文表示,我们高度重视质量,在小米YU7研发过程中,仅北京到上海的道路实测这个项目我就参与了两次,1250公里的路程全程我自己开,早上六点出发,晚...
2025-06-26
DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是最高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。
你只需要任意一块AMD RX 7000系列显卡,就可以在本地体验DeepSeek。
AMD Radeon游戏卡本地部署DeepSeek非常简单,只需打开AMD官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载AMD Adrenalin 25.1.1测试版驱动,安装并重启。
直接下载地址:
https://www.amd.com/zh-cn/resources/support-articles/release-notes/RN-RAD-WIN-25-1-1.html
然后打开LM Studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载LM Studio for Ryzen AI安装包,安装并运行。
启动之后,点击右下角设置(可选中文语言),找到并开启“Use LM Studio's Hugging Face”这个选项。
回到主界面,在左侧菜单栏点击搜索图标,输入“DeepSeek R1”,就可以看到已经训练好的各种DeepSeek模型。
至于如何选择,可以参考如下的AMD官方推荐列表,比如旗舰级的RX 7900 XTX可以支持到32B参数,主流的RX 7600则仅支持8B模型。
顺带一提,最新的中国特供版显卡RX 7650 GRE也同样支持本地部署DeepSeek,只待正式发布。
然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“GPU Offload”的数值,不同选项的具体含义可自行搜索或者直接询问DeepSeek。
模型加载完毕后,就可以尽情地在本地体验DeepSeek了。
与此同时,AMD Instinct GPU加速卡也已经部署集成DeepSeek V3模型,并优化了SGLang性能,支持完整的671B参数,开发者可以借助AMD ROCm平台快速、高效地开发AI应用。
1、启动Docker容器
docker run -it --ipc=host --cap-add=SYS_PTRACE --network=host \
--device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \
--group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630
2、开始使用
(1)、使用CLI登陆进入Hugging Face。
huggingface-cli login
(2)、启动SGLang Server,在本地部署DeepSeekV3 FP8模型。
python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-V3 --port 30000 --tp 8 --trust-remote-code
(3)、服务器启动后,打开新的终端,发送请求。
curl http://localhost:30000/generate \
-H "Content-Type: application/json" \
-d '{
"text": "Once upon a time,",
"sampling_params": {
"max_new_tokens": 16,
"temperature": 0
}
}'
3、基准测试
export HSA_NO_SCRATCH_RECLAIM=1
python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code
python3 -m sglang.launch_server --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code
python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8
Accuracy: 0.952
Invalid: 0.000
另外,如果需要BF16精度,可以自行转换:
cd inference
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
小米创办人雷军发文表示,我们高度重视质量,在小米YU7研发过程中,仅北京到上海的道路实测这个项目我就参与了两次,1250公里的路程全程我自己开,早上六点出发,晚...
2025-06-26
为切实保障航空运行安全,民航局今日发布紧急通知。自6月28日起禁止旅客携带没有3C标识、3C标识不清晰、被召回型号或批次的充电宝乘坐境内航班。...
2025-06-26
据媒体报道,帕金森症目前无法根治,早期诊断与干预是延缓病情发展的关键。然而,现有临床诊断方法主要依赖主观评估和昂贵检查,难以进行大规模早期筛查。针对这一难题,浙...
2025-06-26
就在今日,梅赛德斯-AMG官方正式发布了梅赛德斯-AMGGTXX概念车,新车基于AMG.EA纯电架构平台上打造,拥有诸多创新科技。...
2025-06-26
昨日,胖东来发布了一则关于“DL精酿小麦啤酒”的维权胜诉公示。从2024年7月开始,市面上出现一批“麦感觉”精酿小麦啤酒,该产品使用了与胖东来公司“DL精酿...
2025-06-26
据媒体报道,宇树科技CEO王兴兴在天津夏季达沃斯论坛上分享了公司快速发展的成功经验。他指出,全球范围内机器人行业正成为继AI之后最受关注的领域,这为宇树科技的成...
2025-06-26
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6