搜索: "多模态能力"

共找到 4 篇相关文章

DeepSeek新增图像解读功能，首试其占卜效果

陈骏达和云鹏共同编辑了这篇关于DeepSeek多模态能力的文章。据报道，DeepSeek的全新视觉识别功能正在灰度测试阶段。被选中的用户可以发现，在DeepSeek的应用首页上新增了一个“识图模式”的选项。通过上传图片，系统能够像人类一样理解各种物体和场景。DeepSeek的研究团队第一时间分享了这一创新成果。其中一位研究员陈德里表示，“天才多模态同事们”使得小鲸鱼具备了观察世界的独特能力。我们也

科技2026/4/304 阅读

阿里发布Qwen3.5-Omni，多模态能力超越Gemini-3.1 Pro

阿里发布Qwen3.5-Omni，多模态能力超越Gemini-3.1 Pro 量子位的朋友们 2026-03-30 22:21:45 量子位

AI2026/3/312 阅读

Jeff Dean畅谈未来：每位开发者将管理50个智能体，编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话，探讨了从模型设计到应用实践等多个方面。本次访谈中，Jeff Dean分享了他对当前大语言模型的看法，并强调了未来的发展趋势。在讨论多模态能力时，Dean指出，早期强调视频输入是为模型提供最高带宽的沟通方式。关于Gemini项目的起源和进展，Dean提到多个团队独立研发算力分散的问题及整合后的成果。谈话中还探讨了在编程任务上使用AI助手

AI2026/3/115 阅读

千问3.5荣登全球开源大模型排行榜第四，仅用十分钟完成五小时内编程任务

2月26日，全球最大AI开源社区Hugging Face发布了最新的排行榜，阿里千问3.5模型包揽了前四名的位置，成为全球最热门的开源模型之一。据了解，新上榜的三款中型千问3.5模型在多个榜单中的表现均明显优于GPT-5 mini，并且其原生多模态能力和代理功能强大，性能达到了中等尺寸模型的新高度。部分模型甚至可以直接部署在消费级显卡上，在开源不到24小时内便成功登顶。最新一期全球开源模型排行榜显

AI2026/2/278 阅读