景区表演火焰山结果真着火了 起初大家以为特效!
5月10日,多名网友发布视频称,长春动植物园表演“火焰山”时园区起火,现场浓烟滚滚,网友称演出第二场不播了,起初大家以为特效,还在说这效果太真了,后面发现真着火...
2025-05-11
日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化,让DeepSeek R1可以在如A100等老型号GPU上进行部署。
据介绍,DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持(如Ada、Hopper架构芯片),其他型号GPU(如A100)无法直接部署。
虽然可以将FP8权重反量化为BF16权重后,在A100等GPU上进行推理,但是这对显存的要求提升了一倍,推理吞吐也会下降。
为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试,发现使用INT8量化后模型精度基本无损。
基于INT8量化,DeepSeek R1模型解锁了芯片限制,可以部署到A100等其他型号GPU;并且相比BF16实现了50%的吞吐提升,进一步降低了推理成本。
目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了Hugging Face社区:
https://huggingface.co/meituan/DeepSeek-R1-Block-INT8
https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8
对具体过程感兴趣的,可以查看官方技术报告。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
5月10日,多名网友发布视频称,长春动植物园表演“火焰山”时园区起火,现场浓烟滚滚,网友称演出第二场不播了,起初大家以为特效,还在说这效果太真了,后面发现真着火...
2025-05-11
如今的主板M.2SSD插槽位普遍都预装了散热片,但是技嘉新款X870/B850AORUSStealtchICE更进一步,大大提高了M.2散热片的效率。...
2025-05-11
据报道,近日,荔枝价格从70多元一斤跌到40多元一斤,杭州一水果店老板娘称:预计端午节前后大量上市,到时价格甚至可能会掉一半。自年初起,草莓、车厘子、蓝莓等以往...
2025-05-11
谁能想到,大米竟然成了日本母亲节,最热门的礼物。据国内媒体援引日媒报道,在米价连创新高背景下,大米意外成为日本母亲节热门礼物。...
2025-05-11
新款奔驰C级的最新路试谍照近日曝光,作为中期改款车型,新车在外观上进行了一定幅度的调整。尾灯部分的变化尤为引人注目,其内部结构采用了与现款奔驰E级相似的设计,带...
2025-05-11
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6