“长相完美”听障女孩植入人工耳蜗 正在进行语训康复!
最近,西安美术学院运动会开幕式上,听障女大学生@宸玥 举牌的视频在网络上走红。目前,宸玥已植入人工耳蜗,正在进行语训康复。语训康复课上,她从拼音发音开...
2025-05-09
自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!
今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。
据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。
而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
打开chat.qwen.ai,左上角选择QwQ-32B-Preview
同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。
据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。
而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。
规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。
另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。
Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。
受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
最近,西安美术学院运动会开幕式上,听障女大学生@宸玥 举牌的视频在网络上走红。目前,宸玥已植入人工耳蜗,正在进行语训康复。语训康复课上,她从拼音发音开...
2025-05-09
据央视报道,近期,有游客在广东珠海横石基沙滩、木头冲沙滩等地发现了一些像塑料袋一样的物体,很多人还会用手触碰,其实这些都是有毒水母,触摸后易被蜇伤!据统计,我国...
2025-05-09
上汽奥迪的A5LSportback车型开始接受预订了,而且这次玩的是“盲订”,就是说现在还不知道最终售价,但你可以先交999元的意向金。...
2025-05-09
据外媒报道,苹果智能眼镜预计将在2026年末或2027年初与消费者见面,这一时间点比此前多数预测的2030年左右大幅提前。苹果智能眼镜产品代号为“N401”,...
2025-05-09
奔驰AMG系列的全新电动性能车终于揭开面纱。这款新车定位为溜背式四门轿跑车,采用了奔驰最新的家族设计语言,细节上借鉴了MercedesVisionAMG概念...
2025-05-09
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6