探索腾讯混元-DiT:国产文生图开源模型的无限可能

⭐发布日期:2024年10月05日 | 来源:央视网选

⭐作者:玛拉·明迪尔 责任编辑:Admin

⭐阅读量:732 评论:8人

【新澳门好彩天】

【新澳天天开奖资料】

【2024澳门免费精准】 【二四六天天开奖免费资料文字大全】 【2024澳门天天开好彩大全打开网站免费大全】 【新奥精准资料免费提供】 【新奥门特免费资料大全7456】 【2024年澳门蓝月亮资料】 【2024新澳门2024免费原料网】 【20040新澳全免费资料】
【澳门天天开彩大全免费】 【新澳2024年精准资料期期金牌谜语】 【一肖一码100准中奖香港】 【2024香港港六开奖结果】 【2024澳门历史开奖记录查询表最新】 【香港开奖+澳门开奖】 【澳门管家婆最准一肖一码正版今晚】 【2024澳门传真】

你是否曾经想过,用中文诗词来描绘出美丽的图画?你是否曾经想过,让 AI 模型更好地理解和生成中文文本?你是否曾经想过,在 win10 系统上本地部署一个强大的文生图模型,享受创作的乐趣?如果你有这样的想法,那么你一定不能错过腾讯混元-DiT,这是一个国产的文生图开源模型,它具有以下特点:

中英文双语 DiT 架构

Hunyuan-DiT 是潜在空间中的扩散模型,如下图所示。根据潜在扩散模型,我们使用预训练的变分自动编码器 (VAE) 将图像压缩到低维潜在空间,并训练扩散模型以使用扩散模型学习数据分布。我们的diffusion扩散模型使用转换器transformer进行参数化。为了对文本提示进行编码,我们利用预训练的双语(英语和中文)CLIP 和多语言 T5 编码器的组合。

多轮 Text2Image 生成

理解自然语言指令并与用户进行多轮交互对于文本转图像系统非常重要。它可以帮助构建一个动态且可迭代的创作过程,逐步将用户的想法变为现实。研发团队训练 MLLM(多模态LLM) 来理解多轮用户对话并输出新的文本提示,用于图像生成,用来支撑混元-DiT模型进行多轮对话和图像生成的能力

如果你对腾讯混元-DiT 感兴趣,那么你可以按照以下步骤进行 win10 本地部署体验:

01.准备工作:

你需要一台 win10 系统的电脑,并且安装了 Python 3.10 及以上版本,以及 TensorFlow 2.13 及以上版本。你还需要下载腾讯混元-DiT 的开源代码和模型权重,你可以在官网地址或GitHub 项目地址上找到它们。

https://github.com/tencent/HunyuanDiT

02. 安装依赖:你需要在命令行中运行以下命令,安装腾讯混元-DiT 的依赖库:

git clone https://github.com/tencent/HunyuanDiT

d ./HunyuanDiT python -m pip install -q -r requirements.tx

03. 安装flash-attention适合win依赖

https://github.com/bdashore3/flash-attention/releases

pip install

flash_attn-2.5.8+cu122torch2.3.0cxx11abiFALSE-cp310-cp310-win_amd64.whl

这里注意,需要安装PyTorch2.1.x和cuda 12.x。具体选择哪个下载,需要先运行pip debug --verbose,根据输出里面的Compatible tags来选择兼容的wheel文件。

04. 模型下载

python -m pip install -q "huggingface_hub[cli]" mkdir ckpts huggingface-cli download Tencent-Hunyuan/HunyuanDiT --local-dir ./ckpts

05. 代码修改

这里app/hydit_app.py需要修改代码,默认使用443端口可能会被占用。同时,如果有请gradio依赖版本报错,请根据提示版本pip安装。

if __name__ == "__main__": interface = ui() interface.launch(server_name="0.0.0.0", server_port=7875, share=True) interface.launch(server_name="127.0.0.1", server_port=7875, share=False, inbrowser=True)

06. WebUI推理

针对低显存建议使用参数 --no-enhance,否则出图速度很慢(24G显存一张图需要超过12分钟

# Using Flash Attention for acceleration. --infer-mode fa

# Start with English UI python app/hydit_app.py --no-enhance --lang en --infer-mode fa # By default, we start a Chinese UI.sh #python app/hydit_app.py --no-enhance --lang zh --infer-mode fa

07. 部署过程报错问题解决

1、DLL load failed while importing awq_inference_engine报错如下

File "C:\Users\Administrator\pinokio\bin\miniconda\lib\site-packages\awq\modules\linear.py", line 4, in <module> import awq_inference_engine # with CUDA kernelsImportError: DLL load failed while importing awq_inference_engine: 找不到指定的模块。

解决方法:

https://github.com/oobabooga/text-generation-webui/issues/4253git clone https://github.com/casper-hansen/AutoAWQ -c http.proxy="http://127.0.0.1:2081"cd AutoAWQpip install -e .

2、修改默认迭代步数,同时请不要开启文本增强否则会报错如下

NotImplementedError: Cannot copy out of meta tensor; no data!

3、

No module named

transformers.models.starcoder2 报错如下ModuleNotFoundError: No module named transformers.models.starcoder2

解决方法:

pip install --upgrade transformers

WebUI界面

打开浏览器输入local URL: http://0.0.0.0:7875,或者public URL:

https://2278a840a9f6bc4a3a.gradio.live

输入文本:你可以在文本描述中输入文本,例如“床前明月光,疑是地上霜”,然后提交生成。

生成图像:腾讯混元-DiT 会根据你输入的文本,生成一张相应的图像,并显示在屏幕上。你可以保存这张图像,或者继续输入其他文本,生成更多的图像。

通过以上步骤,你就可以在 win10 系统上本地部署和体验腾讯混元-DiT 了。你可以用它来创作各种有趣和有创意的作品,例如中文诗词绘图、故事插图、艺术设计等。你也可以将你的作品分享给其他人,让他们欣赏和评价你的才华。

腾讯混元-DiT 是一个非常有潜力和价值的文生图开源模型,它为中文语言处理和图像生成领域带来了新的突破和机遇。如果你是一个对 AI 技术感兴趣的开发者或创作者,那么你一定不要错过这个模型。快来下载和使用腾讯混元-DiT 吧,让你的创意和想象飞翔!

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门六开彩天天资料大全】
上一条新闻 下一条新闻

推荐文章

发表评论

早雾Seina

9秒前:为了对文本提示进行编码,我们利用预训练的双语(英语和中文)CLIP 和多语言 T5 编码器的组合。

IP:66.12.1.*

陈男

2秒前:x。

IP:89.34.3.*

세희

2秒前:interface.

IP:26.58.9.*

央视网选APP介绍

APP图标

澳门六开彩最准免费网站APP名:央视网选

版本:V6.37.334

更新时间:2024-10-04 20:16

奥门彩这是一个功能强大的新澳今天最新资料311APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:理解自然语言指令并与用户进行多轮交互对于文本转图像系统非常重要。

新澳门资料大全APP介绍

APP图标

新澳门六开彩开奖网站APP名:央视网选

版本:V8.39.251

更新时间:2024-10-04 24:13

4949澳门精准免费大全凤凰网9626这是一个功能强大的天天好彩免费资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:2、修改默认迭代步数,同时请不要开启文本增强否则会报错如下NotImplementedError: Cannot copy out of meta tensor; no data!

澳门2024全年免费资料大全APP介绍

APP图标

澳门天空网APP名:央视网选

版本:V8.11.665

更新时间:2024-10-04 13:24

澳ⅰ门天天好彩这是一个功能强大的溴门天天彩最准最快资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:com/oobabooga/text-generation-webui/issues/4253git clone https://github.

2024澳门彩开奖结果APP介绍

APP图标

2024新奥正版资料免费251期APP名:央视网选

版本:V4.55.627

更新时间:2024-10-04 21:13

澳门2024免费资料大全这是一个功能强大的全年免费资料APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:研发团队训练 MLLM(多模态LLM) 来理解多轮用户对话并输出新的文本提示,用于图像生成,用来支撑混元-DiT模型进行多轮对话和图像生成的能力。

204年新奥开什么今晚APP介绍

APP图标

2024澳门今晚最新的消息APP名:央视网选

版本:V1.38.387

更新时间:2024-10-04 24:15

2024年正版资料大全这是一个功能强大的澳门一肖一码准确收视网APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:07.

2024年新澳门好彩正版资料免费大全APP介绍

APP图标

2024新澳门天天开好彩大全孔的五伏APP名:央视网选

版本:V9.69.166

更新时间:2024-10-04 19:24

2024新奥天天资料免费大全这是一个功能强大的2024年澳门天天开奖结果APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:安装flash-attention适合win依赖

新澳门彩出号走势图手机版2024APP介绍

APP图标

新澳门天天开奖资料大全APP名:央视网选

版本:V8.53.594

更新时间:2024-10-04 23:16

2004新澳门天天开好彩挂牌这是一个功能强大的2024澳门天天六开彩免费资料第114期APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:报错如下ModuleNotFoundError: No module named transformers.

澳门一码一肖一特一中今晚APP介绍

APP图标

澳门挂牌之全篇更新100APP名:央视网选

版本:V7.43.845

更新时间:2024-10-04 15:23

香港二四六开奖免费结果118这是一个功能强大的新澳门2024年资料大全管家婆APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:01.