搜索: "文字渲染"

共找到 4 篇相关文章

智象未来发布超两千亿参数图像大模型,并宣布完成新一轮亿级融资

智象未来发布超两千亿参数图像大模型,并宣布完成新一轮亿级融资

凤凰网科技讯 5月20日,智象未来在北京举办开放日,发布基于原生全模态架构Unified Transformer的图像大模型HiDream-O1-Image-Pro,参数量超2000亿。该模型将图像像素、文本标记与任务条件统一纳入连续共享标记空间,在通用文生图、高保真文字渲染、图像编辑等任务上取得SOTA表现。此前,采用同架构的8B开源版本HiDream-O1-Image曾在Artificial

科技2 阅读
百度再推开源项目:消费级GPU也能运行的文本渲染技术挑战Nano Banana

百度再推开源项目:消费级GPU也能运行的文本渲染技术挑战Nano Banana

百度近期正式向公众开放了其文心大模型团队开发的ERNIE-Image图形生成系统,该系统的参数规模仅为8B,在仅需24GB显存的消费级GPU上就能运行。在多个国际评估标准中,ERNIE-Image表现出色,在GenEval、OneIG等关键测试中的综合得分均列开源模型之首。尤其在文字渲染方面,其性能与Nano Banana等商业闭源系统处于同一水平线上。此外,团队还同时发布了ERNIE-Image

科技6 阅读
阿里最新发布:个性化人脸定制模型正式亮相

阿里最新发布:个性化人脸定制模型正式亮相

阿里巴巴近期推出了一款名为Wan2.7-Image的全新图像处理模型,集成了文本到图像生成、多图批量制作、指令驱动编辑和交互式修改等多功能于一体。新发布的这款软件具有四大核心功能:个性化定制面部特征、“调色盘”色彩控制、高质量文字渲染以及精准区域选择性编辑。在测试过程中,我们着重考察了模型的个性面孔生成、互动编辑及跨场景人物一致性三个关键领域的能力。通过使用基础指令词“年轻女性半身像,电影质感光影

科技16 阅读
Image2.0千问版本更新上线

Image2.0千问版本更新上线

3月13日,千问App推出了Qwen-Image2.0图像生成与编辑模型。该模型能够实现图文转换和多种编辑功能,包括从文本生成图像、基础编辑以及多场景创作,而且在文字渲染、材质真实感和指令解析方面都有了显著的进步。千问App新发布了Qwen-Image2.0版本的图像处理工具

国内4 阅读