搜索: "图像处理"

共找到 8 篇相关文章

京东发布开放源代码的图像编辑工具JoyAI-Image-Edit

4月7日，京东探索研究院对外发布了其自主研发的JoyAI-Image-Edit图像处理模型，并宣布将其开源。此款模型是业界首个深度融合“空间智能”的开放源代码解决方案，它使人工智能技术能够理解和编辑三维空间，超越了以往仅限于平面修改的能力。开发者可以直接利用该模型创建各种应用。JoyAI-Image-Edit 模型全面模拟真实世界的空间结构规律，在多个方面进行了建模，包括视角一致性、相机感知和场景

科技2026/4/102 阅读

AI与修图的新篇章：像素蛋糕9.0引发行业巨变

AI图像处理技术迎来革新——像素蛋糕9.0问世量子位的朋友们 2026-04-07 15:34:26 量子位修图软件的使用者正

AI2026/4/82 阅读

阿里最新发布：个性化人脸定制模型正式亮相

阿里巴巴近期推出了一款名为Wan2.7-Image的全新图像处理模型，集成了文本到图像生成、多图批量制作、指令驱动编辑和交互式修改等多功能于一体。新发布的这款软件具有四大核心功能：个性化定制面部特征、“调色盘”色彩控制、高质量文字渲染以及精准区域选择性编辑。在测试过程中，我们着重考察了模型的个性面孔生成、互动编辑及跨场景人物一致性三个关键领域的能力。通过使用基础指令词“年轻女性半身像，电影质感光影

科技2026/4/216 阅读

顶尖学府团队革新养殖业！一元成本养龙虾，全方位内容解析，打工人的致富秘籍

新智元报道在竞争对手仍在专注于单点能力时，Agnes已将文本代理、图像处理、视频生成和办公自动化工具整合进开发者工具箱中，提供了一整套AI生产力解决方案。最近，Agnes的核心模型矩阵在Zenmux平台（https://zenmux.ai/models?sort=newest）正式上线，并一次性开放了四款主力模型的调用接口，涵盖文本代理与多模态生成两大核心领域。其中包括Claw系列中的Agnes-

科技2026/4/24 阅读

Image2.0千问版本更新上线

3月13日，千问App推出了Qwen-Image2.0图像生成与编辑模型。该模型能够实现图文转换和多种编辑功能，包括从文本生成图像、基础编辑以及多场景创作，而且在文字渲染、材质真实感和指令解析方面都有了显著的进步。千问App新发布了Qwen-Image2.0版本的图像处理工具

国内2026/3/174 阅读

商汤发布创新多模态架构，挑战全球模型界权威，实现无编码器图像处理技术革新

本文由智东西陈骏达撰写，李水青编辑。近日，商汤科技发布了一篇最新技术博客《NEO-unify：原生架构促进端到端多模态理解和生成统一》，介绍了他们研发的全新模型架构。该模型通过在底层整合多种模式的理解与生成，实现了更高的训练效率和数据处理能力。当前的技术趋势显示，大多数多模态系统会采用视觉编码器来理解图像信息，并利用变分自编码器进行内容创作。这种方法尽管有效，但在模块间的协作上却存在一些局限性。N

科技2026/3/77 阅读

可灵携手滑铁卢大学发布UniVideo：引领视频理解与创造新时代

在多模态内容的理解和生成领域，统一的多模型已经显示出显著的效果，但这些成果主要集中在图像处理上。近日，滑铁卢大学与快手可灵团队共同研发出了一种名为 UniVideo 的创新性系统。该系统能够在单一框架下执行视频理解、创建及编辑任务，并且基于一个多模态生成模型构建而成。UniVideo 采用双通道结构设计，将大规模多模态语言模型（MLLM）的指令理解和推理能力与多模态扩散 Transformer（M

科技2026/3/611 阅读

真我12 Pro系列配备6400万像素潜望式长焦镜头支持120倍数字变焦

1月12日，真我realme宣布推出全新真我12 Pro系列手机，该系列配备了6400万像素的超光影潜望长焦镜头，并与高通合作优化了超光影引擎。真我12 Pro系列中的潜望长焦摄像头采用了OV64B旗舰级传感器，这是迄今为止像素最高的潜望式长焦镜头之一，能够提供3倍光学变焦、6倍无损变焦以及最高可达120倍的数码变焦功能。真我公司表示，通过与高通联合开发的超芯影像异构框架，图像处理速度提升了高达1

科技2026/2/265 阅读