成筐充电宝被拦:有人当场崩溃!
据媒体报道,近日充电宝安全事件引发广泛关注。在社交平台上,不少网友发帖称“成筐的充电宝被拦下”,其中一位网友称,他的两个罗马仕充电宝都被拦下来了,这两个充电宝加...
2025-06-27
日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化,让DeepSeek R1可以在如A100等老型号GPU上进行部署。
据介绍,DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持(如Ada、Hopper架构芯片),其他型号GPU(如A100)无法直接部署。
虽然可以将FP8权重反量化为BF16权重后,在A100等GPU上进行推理,但是这对显存的要求提升了一倍,推理吞吐也会下降。
为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试,发现使用INT8量化后模型精度基本无损。
基于INT8量化,DeepSeek R1模型解锁了芯片限制,可以部署到A100等其他型号GPU;并且相比BF16实现了50%的吞吐提升,进一步降低了推理成本。
目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了Hugging Face社区:
https://huggingface.co/meituan/DeepSeek-R1-Block-INT8
https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8
对具体过程感兴趣的,可以查看官方技术报告。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
据媒体报道,近日充电宝安全事件引发广泛关注。在社交平台上,不少网友发帖称“成筐的充电宝被拦下”,其中一位网友称,他的两个罗马仕充电宝都被拦下来了,这两个充电宝加...
2025-06-27
据报道,兄弟公司旗下689款打印机,以及富士胶片、东芝和柯尼卡美能达公司的53款其他型号存在漏洞,容易受到针对其管理员密码的攻击。报道称,安全研究人员最近发现8...
2025-06-27
据媒体报道,57岁的郑阿姨(化名)在体检中发现食管存在可疑病灶,经医院复查后,被确诊为食管早癌,同时伴有慢性胃炎和胃息肉。医生询问病史得知,郑阿姨坚信“吃热的养...
2025-06-27
vivo官网显示,vivoXFold5将于7月2日正式发售,起售价是6999元(12GB+256GB)。这是行业内最轻大折叠,其重量最低是217g(钛度),...
2025-06-27
今日下午,@蔡澜微博发布讣告:蔡澜先生于6月25日在亲友陪同下,在香港离世,享年83岁。讣告表示,遵从先生遗愿,为免叨扰亲朋,不设任何仪式,遗体已火化。...
2025-06-27
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6