太好了是开源 3D 模型,我们有救了!

发布日期:2024-11-13 22:24

来源类型:搜狐网 | 作者:Jastrzembska

阅读提醒: 内容编辑丨特工女巫 排版审核丨特工少女 还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包...
【新澳资料免费精准期期准】 【2024新澳免费资料图片】 【澳门天天开彩免费资料大全新版】 【新澳特精准资料】 【2024年新澳天天开彩最新资料】 【新澳资料最准的网站】 【7777788888新澳门开奖结果】 【澳门正版资料大全】 【2024新奥门精准正版资料免费大全】 【2024新澳门免费原料网大全】 【2024新澳最精准资料大全】 【2024年正版资料免费大全公开】 【澳门正版免费全年资料】

内容编辑丨特工女巫

排版审核丨特工少女

还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包装盒的立体效果图。

但与团队讨论,结论是,由于市面上还没有很好的开源的 3D 模型可以用,其他技术方案开发成本又比较高,生成 3D 内容的想法于是作罢。

转眼一年不到,惊喜地发现混元上了个 3D 模型,可以轻松实现当年的预期效果了。

光说不做假把式,腾讯混元 3D 生成大模型已经与腾讯内部业务场景结合落地了,如 UGC 3D 创作、商品素材合成、游戏 3D 资产生成等。

此前,腾讯地图就利用混元 3D 大模型,上线了「自定义 3D 导航车标」功能。用户可以创作个性化的 3D 导航车标。

腾讯混元 3D 大模型,相比传统方案,使 3D 车标生成速度提升了 91.1%,生成成功率从 50% 提升至 97.4%,从个性化新意和效率上都提升了用户体验。

此外,元宝里的「3D 角色梦工厂」功能,也正是基于混元 3D 团队的技术。

用户只需上传一张五官清晰的正面头像,选择不同角色模版,就能迅速生成个性化的 3D 人物形象。3D 形象生成完成后,用户可以对形象从 360 度随意查看,也可以选择把形象分享公开,将 UGC 曝光到平台。

此前吴恩达在一次线上采访交谈中( 吴恩达,对 Agentic Workflow 持续兴奋 ),也表示了他对于 AI 业内开源闭源争议的看法。

吴恩达认为更多的开源会让世界变得更好,让很多人过得更好;闭源实际上是非常危险的,这不利于创新,不利于融入世界 LLM 的供应链中;开源带来的好处远大于闭源造成的伤害。

业内已经看到的如国内的通义、国外的 Llama 系列模型热衷开源步调,腾讯混元大模型也正在加速开源节奏。

自从上次 5 月 14 日混元将其文生图大模型对外开源,成为业内首个中文原生的 DiT 架构文生图开源模型。

就在今天 11 月 5 日,特工们注意到,混元宣布了最新的 3D 生成模型「Tencent-Hunyuan3D-1.0」正式开源,包括模型权重、推理代码、模型算法的全面开源;开发者可在 Huggingface、GitHub 等技术社区直接下载。

据悉, Tencent-Hunyuan3D-1.0 又是业界首个同时支持文生 3D、图生 3D 的开源模型?

论文地址:https://3d.hunyuan.tencent.com/hunyuan3d.pdf

3D 模型是 GenAI 多模态内容生成的关键,使模型生成能力更加接近现实世界真实立体事物的生产。

对于一个 3D 模型,可以从生成内容的质量、速度、泛化性角度考察。

1. 质量方面,经过多个维度测评,在两个公开的 3D 数据集 GSO 与 OmniObject3D 上, Tencent-Hunyuan3D-1.0 效果优于主流开源模型,并且生成质量上全面超过了 SOTA 开源模型,整体能力属于国际领先水平。

2. 速度方面,据官方公开披露,Tencent-Hunyuan3D-1.0 最快仅需 10s 即可生成一个 3D 作品,缩短的时长对用户来说是友好且效率的。

3. 泛化性方面,混元 3D 生成大模型可构建各类尺度、形态、场景的物体,大型如建筑楼宇,细微如花草动物。

为了提升上述提及的过往 3D 生成模型在生成速度和泛化能力上的不足,混元团队采用了两阶段生成方法,既保证基础的生成的质量和可控,又能加快生成速度。

第一阶段,腾讯混元采用的是一种轻量级的多视角扩散模型,它可以在约 6 秒内高效生成多视角图像。这一步的作用在于,将一个整体的复杂 3D 生成任务,通过不同视角捕捉的 3D 资产的纹理和几何特征,从单视角重建转化为难度更低的多视角重建任务。就好像一个美术生,对一个复杂立方体,先分别观察其各个面的细节。

第二阶段,腾讯混元引入了一种快速的重建大模型,利用上一阶段生成的多视角图像,这个模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型的强大之处在于,它可以学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构。最终,该模型可以实现输入任意单视角生成 3D 资产。就像上述美术生观察完各面后,还会主动学习思考如何更好处理各面的质量,最终制作一个 3D 作品。

总体来说,此次腾讯混元开源的 Tencent-Hunyuan3D-1.0,相较于过往的 3D 模型,在生成速度和泛化能力上有较大提升;不难想象,这样一款更强的 3D 生成大模型,可以帮助设计师、创作者、艺术家等自动化生产 3D 资产;在玩具手办、3D 打印、广告舞美等行业,用于数字或实物商品的制作,激发个性化创意,提高生产效率。

除此之外,在大语言模型方面,特工也关注到腾讯还开源了更强大的 MoE 开源大语言模型——「腾讯混元Large」,它具有以下几点特质。

1. MoE 混合专家结构:每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型,这使得混元 Large 可以在保证模型推理速度的同时,显著提升模型的参数量进而提升模型性能。 Large 模型还创新了路由策略,提出随机补偿的路由方式,有效提升模型内专家的利用率和稳定性,从而提升模型性能表现

2. 参数量和上下文长度:模型总参数量 389B,激活参数量 50B,上下文长度达 128k, 是当前业界参数规模最大、效果最好的开源 MoE 模型。(根据公开的测评结果,腾讯混元 Large 在 CMMLU、MMLU、CEval、AGIEval 等多学科综合评测集、中英文 NLP 任务、代码和数学等 9 大维度全面领先,超过 Llama3、Mixtral 等国外一流的开源大模型)

3. 高质量训练数据:LLM 的进步与数据密不可分,混元 Large 模型在天然文本语料库的基础上,利用大语言模型构建了高质量、高多样性、大量级的合成数据,提升了模型在长文、数学和代码等各个领域的性能。

4. 开发者友好:同时,混元通过技术优化,将 Large 模型变得更适配开源框架的精调和部署,对开发者来说很实用。

目前,腾讯混元大模型 PaaS 平台已开放支持包含混元 Large 模型在内的十余种混元 API 服务调用,可以满足企业及开发者对于不同模态(文生文、图生文、文生图)、不同专项(角色扮演、Function-Call、代码等)的模型需求。

1. github(开源模型工具包):https://github.com/Tencent/Hunyuan-Large

2. huggingface(模型卡片&模型上传):https://huggingface.co/tencent/Hunyuan-Large/tree/main

3. huggingface demo 地址:https://huggingface.co/spaces/tencent/Hunyuan-Large返回搜狐,查看更多

责任编辑:

【2004新澳精准资料免费】 【新奥门资料免费资料大全】 【二四六管家婆期期准资料】 【澳门免费权威资料最准的资料】 【2024年天天彩免费资料】 【新澳资料免费长期公开吗】 【澳门天天开彩大全免费】 【2024年新澳门精准管家婆天天】 【2024年澳门天天开好彩最新版】 【2024年澳门的资料】 【新澳门免费资料大全在线查看】 【2024臭门正版资料大全】 【新奥门资料大全免费澳门资料】 【澳门免费材料资料】
【新奥天天免费资料大全】 【澳彩资料免费长期公开】 【新奥最新版精准特】 【澳门六开彩资料免费大全今天】 【新澳门免费资料大全精准版】 【澳门版全年免费大全】 【新奥天天免费资料的注意事项】 【新澳天天开奖资料大全最新】 【新奥天天免费资料单双中特】 【2024新奥精准正版资料】 【2024正板资料免费公开】 【2024年新奥门管家婆资料先峰】 【最准一肖一码100%澳门】 【新奥门特免费资料大全澳门传真】

下载中心

视频封面

视频名称:中国崛起,无法避免战争:一场大战,将在一个无法回避的地点爆发

大小: 6.9GB 下载:(834244) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:充满志气底气锐气朝气的百年大党宣言

大小: 5.3GB 下载:(895420) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:若特朗普当选后加征关税,出口有多大影响?

大小: 8.3GB 下载:(135020) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:美联储再降25bp!特朗普的各项主张,对我们的投资意味着什么?

大小: 5.6GB 下载:(91509) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:美国大选结果何时揭晓?重要节点观战指南来了

大小: 8.9GB 下载:(99682) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:“短视频说书”各显神通 成了年轻人“蹲更新”的读书搭子

大小: 2.5GB 下载:(606975) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:权威智库报告即将发布,聚焦当下中欧关系三大关键问题

大小: 7.4GB 下载:(823937) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:最前线|加拿大政府又下禁令,狂奔的TikTok再蒙阴影

大小: 1.7GB 下载:(855907) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:让更多科技创新“领头雁”展翅飞翔

大小: 5.5GB 下载:(609551) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:人财两空?女子收50万彩礼后出轨前男友,丈夫提离婚,彩礼难追回

大小: 6.5GB 下载:(344106) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:LOL《双城之战2》成本公开,共花费七亿,拳头心血之作,送给玩家

大小: 4.2GB 下载:(553051) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:被气死是真的?首都国际机场T3停车场两名男子发生争吵,一人晕倒

大小: 1.9GB 下载:(232900) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:宾馆客房9个位置易藏针孔摄像头,这一招能找到可疑的地方

大小: 8.9GB 下载:(975654) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:【光明网评】汇聚正能量星火,书写强国复兴篇章“男友生日让他选礼物,他想要千元车模我嫌浪费错了吗?”

大小: 4.1GB 下载:(669916) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国一姐夺冠!郑钦文创6项纪录,获101万巨奖,登上《新闻联播》“就是没包好蒸裂开的包子!”董宇辉调侃内蒙古羊肉烧卖引争议

大小: 8.5GB 下载:(597111) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:古希腊的黄金时代:古典时期

大小: 5.2GB 下载:(846129) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:王俊凯hi6首秀,与杨迪演绎神级推理,吴昕贡献全年运动量“天才少女”姜萍事件最终结果:老师提供指导,违反数学竞赛规则

大小: 2.9GB 下载:(874359) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中企西进沙特之观察:传统与现代的碰撞 期待产业与金融互融

大小: 8.1GB 下载:(995420) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《珠帘玉幕》:杠上了,张晋然要查贪腐,燕子京要报仇。

大小: 2.4GB 下载:(83793) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:满屏都是双11跳转广告,但消费者依旧想逃50岁老太给别人哭灵22年,一场3000元、一天接3场一年磕上万次头

大小: 8.5GB 下载:(825577) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《永夜星河》热度破3万!新剧情小虐牵动观众,竹林四侠下集重聚

大小: 7.9GB 下载:(899404) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:欧巴马任职总统时的1分钟醒脑法

大小: 1.7GB 下载:(10377) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:北京市教委举办校园火灾应急处置桌面推演现场会

大小: 5.6GB 下载:(105378) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国军团6胜4负!00后淘汰奥沙利文,丁俊晖轰6-0,卫冕冠军惨败原创《甄嬛传》拍错了,历史上真实的华妃,结局很不错!

大小: 6.3GB 下载:(491056) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:Kimi,“崩”了!

大小: 9.8GB 下载:(558344) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中方谈中欧关系:最需要去掉的风险是泛政治化带来的对立对抗

大小: 5.2GB 下载:(243436) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:激动!陕西新一波演唱会开票!

大小: 7.1GB 下载:(13685) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:"欧洲人付钱,中国人建造,当然全归功于中国"

大小: 7.7GB 下载:(24811) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:聚焦数字技术,为14个新职业专业人才评价提供专业支撑

大小: 1.9GB 下载:(489630) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:见证者讲述汪清马家屯惊人事件,一日军给我游击军送来十万发子弹

大小: 2.1GB 下载:(970443) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:日本首相发表春节贺词,联合国秘书长也来拜年,开口便是中文

大小: 6.4GB 下载:(101999) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)

评论

打开APP查看24条评论

孙玮伦

6秒前

hunyuan.

秦成公

3分钟前

此前,腾讯地图就利用混元 3D 大模型,上线了「自定义 3D 导航车标」功能。

崔奕

9天前

开发者友好:同时,混元通过技术优化,将 Large 模型变得更适配开源框架的精调和部署,对开发者来说很实用。

发表您的评论: