您所在的位置:首页 - 文化 - 正文文化
腾讯混元文生图开源模型推出小显存版本,仅需显存即可运行
骐锦
2024-08-11
【文化】
871人已围观
摘要2024-07-0510:04:08作者:姚立伟7月4日,腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。模型易用性再提升,个人电脑可轻松运行基于DiT架构的文生图模型生成图片质感更佳,但对显存的要求却非
2024-07-0510:04:08作者:姚立伟
7月4日,腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。
模型易用性再提升,个人电脑可轻松运行
基于DiT架构的文生图模型生成图片质感更佳,但对显存的要求却非常高,让许多开发者望而却步。这也是新版本StableDiffusion模型无法快速普及的原因之一。
应广大开发者的需求,混元DiT推出小显存版本,最低仅需6G显存即可运行优化推理框架,对使用个人电脑本地部署的开发者非常友好。经过与HuggingFace合作,小显存版本、LoRA与ControlNet插件,都已经适配到Diffusers库中。开发者无需下载原始代码,仅用简单的三行代码仅可调用,大大简化了使用成本。
同时,混元DiT宣布接入Kohya,让开发者可以低门槛地训练专属LoRA模型。
Kohya是一个开源的、轻量化模型微调训练服务,提供了图形化的用户界面,被广泛用于扩散模型类文生图模型的训练。用户可以通过图形化界面,完成模型的全参精调及LoRA训练,无需涉及到代码层面的细节。训练好的模型符合Kohya生态架构,可以低成本与WebUI等推理界面结合,实现一整套“训练-生图”工作流。
此外,腾讯混元文生图开源模型推出小显存版本,仅需显存即可运行腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。
相比起业界的开源打标模型,混元Captioner模型能更好的理解与表达中文语义,输出的图片描述更为结构化、完整和准确,并能精准识别出常见知名人物与地标。模型还支持开发者自行补充和导入个性化的背景知识。

混元Captioner模型开源之后,全球的文生图研究者、数据标注人员,均可使用混元Captioner高效地提升自身图像描述质量,生成更全面、更准确的图片描述,提升模型效果。混元Captioner生成的数据集不仅能用于训练基于混元DiT的模型,亦可用于其他视觉模型训练。
众多开发者关注,成最受欢迎国产DiT开源模型
在提升模型易用性的同时,腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。
作为首个中文原生DiT开源模型,混元DiT自全面开源以来,一直持续建设生态。6月,混元DiT发布的专属加速库,可将推理效率进一步提升,生图时间缩短75%;并进一步开源了推理代码;发布LoRA和ControlNet等插件。于此同时,模型易用性大幅提升,用户可以通过HuggingFaceDiffusers快讯调用混元DiT模型及其插件,或基于Kohya和ComfyUI等图形化界面训练与使用混元DiT。
目前,在众多开发者的支持下,混元DiT发布不到2个月,GithubStar数已经超过2.6k,成为最受欢迎的国产DiT开源模型。
Tags: 腾讯混元文生图开源模型推出小显存版本仅需显存即可运行
版权声明: 感谢您对【奚诗百科网】网站平台的认可,无特别说明,本站所有文章均归【奚诗百科网】平台所有,转载请说明文章出处“来源【奚诗百科网】”。 https://sptgyg.com/post/12373.html
上一篇: 小米媒体评价盘点
下一篇: 小米SU7 首次亮相 ChinaJoy
最近发表
- 探索中医智慧,一份全面的中医书籍大全
- 孩子学四书五经有用吗?探索古典智慧的现代价值
- 艺术与设计的桥梁,探索两者之间的联系与差异
- 掌握7279次列车时刻表查询技巧,轻松规划您的旅行
- 艺术与设计的共舞,从画布到生活
- 深入了解vivo X27手机,参数解析与实用指南
- 探索北京,免费景区的无限魅力
- 穿越时空的旋律,1000首怀旧金曲与你共忆美好时光
- 穿越时空的旋律,探索1000首经典怀旧歌曲的魅力
- 艺术与设计的共性,探索创意世界的桥梁
- 自费出书,成本解析与预算规划
- 时光的旋律,二十首老电影金曲与它们背后的银幕故事
- 时光旋律,探索怀旧1000首老歌单曲的魅力与魔力
- 艺术与设计的界限,揭开两者关系的常见误区
- 探索艺术设计之美,一篇论文范文的解析与启示
- 时光的旋律,怀旧老电影插曲原唱的魅力与传承
- 小米发布会直播指南,全方位观看体验,不错过每一个精彩瞬间
- 从笔尖到书架,个人作品出版全攻略
- 如何轻松联系作家出版社,一份详尽的指南
- 探索艺术设计的魅力,从理论到实践的深入解析
- 艺术设计论文写作指南,从构思到完成
- 艺术类设计论文,探索创意与学术的交汇点
- 北京二日游,穿越古今的完美行程
- 郑州购书中心,文化绿洲,知识的殿堂
- 荣耀Play4T Pro,性能与设计的完美结合
- 苹果XS,经典与现代的交汇,是否仍值得入手?
- 2023年笔记本电脑质量十大排名,性能、耐用性与创新的较量
- 影视老歌500首怀旧,穿越时空的音乐之旅
- 穿越时空的旋律,影视老歌曲大全100首
- 深入了解,如何通过苹果手机官网查询序列号
- 深入解析vivo Z5,性能、功能与用户体验的完美结合
- 邓丽君,歌声穿越时空,一百首经典老歌的永恒魅力
- 时光的旋律,一百首经典老歌不停唱
- 穿越时空的通讯伙伴,华为老款3G手机的魅力与智慧
- 魅族应用商店,探索官方下载的便捷与安全
- 艺术设计,当代社会中的黄金钥匙
- 全面掌握,惠普打印机使用教程详解
- 自费出书,如何让你的作品畅销
- 艺术设计专业就业前景,机遇与挑战并存
- 岁月留声,一百首经典老歌精选,唤醒时代的记忆
- 时光回响,一百首经典老歌联唱的不朽魅力
- 艺术设计,不仅仅是美的追求,更是生活的魔法师
- 艺术设计毕业生的职业道路,无限可能与实用指南
- 艺术设计的未来,探索创意产业中的无限可能
- 深入解析,i7与i5处理器的性能对比及选择指南
- 鸿蒙系统,开启智能手机新纪元
- 探索艺术设计的光明未来,最佳出路与职业发展路径
- 小学生文学必读书目,开启智慧之门的金钥匙
- 🎶重温经典,一百首老歌免费听,唤醒你的记忆与情感
- 启航文学之旅,小学生必读的文学瑰宝