你现在的位置是：当前位置：首页 >

通义千问推出多模态统一理解与生成模型 Qwen VLo，图像生成效果如何？有哪些信息值得关注？

更新时间：2025-06-29 07:50:15

2025年6月26日，Qwen团队发布了 Qwen VLo ，一个定位是“unified multimodal understanding and generation model"的模型，包括多模态的理解和生成。

根据官方的介绍博客，Qwen VLo包含下面的功能：图像生成：文生图、2D卡通图像转真实图像图像编辑：例如修改某个主体、更换颜色、更换风格图像算法能力：例如检测框、canny 算子、图像分割结果经过一段时间的测试，我个人的总结是：生图能力：效果比较差，感觉是一两年前生图模型…。

通义千问推出多模态统一理解与生成模型 Qwen VLo，图像生成效果如何？有哪些信息值得关注？

上一篇 : 美国很多地方废弃，为啥很多人宁可在街上流浪，也没有人去开荒种地呢？

下一篇 : GNOME 自带的输入法 iBus 是个怎样的存在?

案例推荐

case recommendation

如何看待不超过1879元的Mac mini（M4+16/256GB+票），易用性吊打同级其他台式电脑？

查看案例
如何评价MiniMax开源首个视觉RL统一框架V-Triune，实现推理感知一肩挑，其技术上有何优势？

查看案例
想深入学习网站后台技术，有哪些建议？

查看案例
为何雷军天天健身，却无健身痕迹?

查看案例
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架？

查看案例
OpenWrt 能做哪些有趣的事？

查看案例
为什么有人会说要崛起要靠西科这种荒唐观点呢？

查看案例
印度为什么老是挑衅中国？他们的目的是什么？难道他们不知道自己几斤几两吗？

查看案例