阿里巴巴今日推出了图像生成与编辑统一模型Wan2.7-Image,旨在解决当前AI生图领域中“标准脸”审美疲劳和色彩单一等问题。
新的模型能够实现个性化定制,“千人千面”,并具备全新的调色盘功能,精准控制颜色。
用户现在可以通过阿里云百炼平台、wan.video网站以及即将上线的千问App体验Wan2.7-Image的功能。

Wan2.7-Image涵盖了从文本生成图像到交互式编辑等一系列能力。
在盲测中,该模型在“文生图”方面的表现超越了GPT-Image1.5和国内其他主流模型,在文本渲染、照片级成像及世界知识方面接近Nano Banana Pro的水平。

针对当前AI生成图像千篇一律的问题,Wan2.7-Image改进了虚拟形象捏脸功能,支持用户全方位定制面部特征。
用户可以选择不同的脸型和眼部特征来实现个性化设计。

新增的“调色盘”功能允许通过Hex Code轻松提取或输入参考图的颜色,并可自由调整颜色数量和比例,以创建独特的配色方案。

目前AI生图的一个难点是处理超长文字时容易出现模糊、错乱等问题。
Wan2.7-Image可以高质量地渲染长达3K tokens的文本内容,支持多种语言,并能保持印刷级别的清晰度。

该模型还能够生成多达12张图像,适用于批量制作风格一致的系列图和多视角建筑图等用途。

它可以从9张参考图片中提取特征,确保合影、电影海报及家具组合图的一致性。

除了生成图像外,Wan2.7-Image还具有理解图像的能力。
训练过程中采用了大规模异构数据集,涵盖各种视觉素材和理解类数据。
在架构设计上,模型采用先进的生成与理解统一架构,无需费力猜测文本对应的画面。
通过多维精细标注体系对图像的布局、文字等进行详细标注,进一步提升了模型的性能。
基于更大规模数据训练而成的专业版Wan2.7-Image-Pro现已上线,生成图像更加稳定且语义理解更准确。
该模型在短剧与影视团队的角色设定、自媒体内容创作以及电商领域的产品图片制作等多个方面有着广泛的应用前景。
在教育和科研领域,用户可以利用Wan2.7-Image快速生成论文配图和信息图表等资料。
最近流行的龙虾热也为该模型带来了新的应用场景。
针对时下大火的龙虾热,Wan2.7-Image 现已支持skill调用,让龙虾画画,全面解锁生成模型的应用场景。
