要弃用x86吗 Arm架构Xbox正在准备中!高通招聘暗藏玄机!
微软近年来一直在大理推动Arm架构PC的发展,而最新消息显示,这一趋势可能扩展到游戏主机领域。根据高通的招聘信息,高通正在招聘以为销售总监,该职位涉及负责下一代...
2025-05-16
今天腾讯正式发布了业内首个毫秒级响应的实时生图大模型——混元图像2.0(Hunyuan Image2.0)。
目前已经在腾讯混元官方网站上线,并对外开放注册体验,该模型主要有两大特点:实时生图、超写实画质。
相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。
在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。
除了速度快以外,腾讯混元图像2.0模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
提示词:人像摄影,爱因斯坦,背景是东方明珠,自拍视角
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面「怎么表达」。
哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔画出来。
除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
腾讯混元图像2.0模型生成的图片:
人像摄影风格
动物特写
复古摄影
动漫风格
真实人物风格
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 3941001135@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
微软近年来一直在大理推动Arm架构PC的发展,而最新消息显示,这一趋势可能扩展到游戏主机领域。根据高通的招聘信息,高通正在招聘以为销售总监,该职位涉及负责下一代...
2025-05-16
为了解决部分人摇号难得问题,北京宣布又一次增发指标。据国内媒体报道称,为更好满足无车家庭用车需求,北京市在定向增发4万个新能源小客车指标的基础上,再次增发2万个...
2025-05-16
Rokid官方今日发布消息称,已与高德地图达成战略合作,联合发布首个全场景智能眼镜导航应用。在交互方式上,用户可通过语音直接与智能眼镜RokidGlasses...
2025-05-16
基于兆芯开先KX-7000处理器推出新一代商用台式机之后,紫光计算机又带来了全新的高性能笔记本“UNISL3893G3”,不仅有兆芯KX-7000加持,整机...
2025-05-16
近期,美国加州里士满市发生多起鸟类离奇死亡事件。美媒报道,自今年2月以来,该市陆续清理出50多只鸟类尸体,众多鸟类在飞行途中突然“爆炸”,尸体坠落在街道或民宅...
2025-05-16
在小折叠屏手机领域,联想motorazr杀疯了,再夺全球第一!根据IDC最新数据显示,2025年第一季度,联想moto以40.4%的市场份额继续领跑全球小折叠...
2025-05-16
热评文章
宾利推出超豪华儿童三轮车 :售价5380元!
日本核污水将排放30年 全球百余家公司已研发“人造海
男孩脚踩兰博基尼炫耀致车损17万 车主再发声:会追责
多地机票跳水!上海飞成都机票降价80%!
2023国庆档票房破26亿:张艺谋电影《坚如磐石》上
曾与林正英、李小龙搭档 著名武打演员孟海去世:终年6