北京现代断尾求生:伊兰特最低仅需6.98万元!
北京现代推出4款车型的置换补贴,包含国补在内至高可补贴2.7万元,补贴车型包括伊兰特、索纳塔、途胜L、库斯途,活动截止时间至8月31日。...
2025-08-18
DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是最高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。
你只需要任意一块AMD RX 7000系列显卡,就可以在本地体验DeepSeek。
AMD Radeon游戏卡本地部署DeepSeek非常简单,只需打开AMD官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载AMD Adrenalin 25.1.1测试版驱动,安装并重启。
直接下载地址:
https://www.amd.com/zh-cn/resources/support-articles/release-notes/RN-RAD-WIN-25-1-1.html
然后打开LM Studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载LM Studio for Ryzen AI安装包,安装并运行。
启动之后,点击右下角设置(可选中文语言),找到并开启“Use LM Studio's Hugging Face”这个选项。
回到主界面,在左侧菜单栏点击搜索图标,输入“DeepSeek R1”,就可以看到已经训练好的各种DeepSeek模型。
至于如何选择,可以参考如下的AMD官方推荐列表,比如旗舰级的RX 7900 XTX可以支持到32B参数,主流的RX 7600则仅支持8B模型。
顺带一提,最新的中国特供版显卡RX 7650 GRE也同样支持本地部署DeepSeek,只待正式发布。
然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“GPU Offload”的数值,不同选项的具体含义可自行搜索或者直接询问DeepSeek。
模型加载完毕后,就可以尽情地在本地体验DeepSeek了。
与此同时,AMD Instinct GPU加速卡也已经部署集成DeepSeek V3模型,并优化了SGLang性能,支持完整的671B参数,开发者可以借助AMD ROCm平台快速、高效地开发AI应用。
1、启动Docker容器
docker run -it --ipc=host --cap-add=SYS_PTRACE --network=host \
--device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \
--group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630
2、开始使用
(1)、使用CLI登陆进入Hugging Face。
huggingface-cli login
(2)、启动SGLang Server,在本地部署DeepSeekV3 FP8模型。
python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-V3 --port 30000 --tp 8 --trust-remote-code
(3)、服务器启动后,打开新的终端,发送请求。
curl http://localhost:30000/generate \
-H "Content-Type: application/json" \
-d '{
"text": "Once upon a time,",
"sampling_params": {
"max_new_tokens": 16,
"temperature": 0
}
}'
3、基准测试
export HSA_NO_SCRATCH_RECLAIM=1
python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code
python3 -m sglang.launch_server --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code
python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8
Accuracy: 0.952
Invalid: 0.000
另外,如果需要BF16精度,可以自行转换:
cd inference
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
北京现代推出4款车型的置换补贴,包含国补在内至高可补贴2.7万元,补贴车型包括伊兰特、索纳塔、途胜L、库斯途,活动截止时间至8月31日。...
2025-08-18
据媒体博鳌大,一名女子在短视频平台上分享了自己骑公路自行车送外卖的经历。据了解,这名女子今年28岁,目前处于工作过渡期,白天学习,晚上利用空闲时间在江苏兼职送外...
2025-08-18
今日,罗永浩微博改名为“罗永浩的十字路口”,同时换了头像,其微博原来名字叫“罗永浩·钮钴禄”。预告中,罗永浩的首个深度长谈播客将于明天中午12点上线,第一期播客...
2025-08-18
博主数码闲聊站表示,小米16系列产品定义和定位都有非常大的变化,ID设计和硬件都有新东西,目前新机已备案但还没公示,首发骁龙8Elite2,可以根据高通峰会...
2025-08-18
标致摩托今日在中国发布了全新的欧系中型踏板车,分为ALLURE版和GT版,起售价为18800元。整车采用具有强烈运动风格的龙骨式车架结构,车身线条流畅,并能呈现...
2025-08-18
据媒体报道,河南郑州一名11岁女孩因身高明显落后于同龄人(仅1.36米),就医后被诊断为矮小症。医生询问生活习惯发现,女孩母亲因个人不吃肉,日常饮食也以素食为主...
2025-08-18
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6