搜索: "多模态技术"

共找到 6 篇相关文章

DeepSeek 推出多模态模型和技术报告;小红书宣布管理层变动:柯南升任总裁;宇树公司揭晓新款双臂人形机器人,售价从2.69万元起 | 科技早报

DeepSeek 推出多模态模型和技术报告;小红书宣布管理层变动:柯南升任总裁;宇树公司揭晓新款双臂人形机器人,售价从2.69万元起 | 科技早报

最近,DeepSeek 在 Github 上发布了新的多模态模型,并公布了相关技术报告。技术报告中指出,虽然多模态大语言模型取得了显著进步,但目前主流的思维链范式仍主要局限于语言学领域。最近的研究重点在于利用高分辨率裁剪技术来解决感知鸿沟问题,但却忽略了参照鸿沟这一核心障碍。自然语言本身的模糊性难以提供精确的空间指引,导致在需要严谨参照的任务中出现逻辑崩溃。DeepSeek 在其多模态技术报告中提

科技5 阅读
DeepSeek发布最新多模态技术框架,聚焦视觉基础单元研究

DeepSeek发布最新多模态技术框架,聚焦视觉基础单元研究

机器之心编辑部随着五一假期的到来,DeepSeek 最新发布了一项技术进展。前一天,陈小康在 X 平台上的一则消息引发了公众对 DeepSeek 多模态功能的关注。一些用户已经能够在 DeepSeek 的网站和应用程序中体验其多模态特性。刚刚,DeepSeek 在 Github 上正式发布了他们的多模态模型,并公开了技术报告。这是一个全新的推理范式,具有开创性的意义。欢迎访问项目主页:https:

科技7 阅读
揭秘DeepSeek“开眼”技术内幕

揭秘DeepSeek“开眼”技术内幕

近日,DeepSeek发布了多模态技术报告《视觉原语思考》(Thinking with Visaul Primitives),详细披露了其新推出的识图模式背后的创新机制。该识图模式采用了名为DeepSeek-V4-Flash的基座模型,参数量达到284B,并拥有13B激活多模态推理模型。这一模型尚未正式命名,但DeepSeek已经确认未来会将其整合进基础模型中进行发布。据介绍,传统的思维链主要在语

科技3 阅读
AI界震动!DeepSeek重大更新引发行业剧变

AI界震动!DeepSeek重大更新引发行业剧变

DeepSeek的「鲸鱼」标志已正式揭开了神秘面纱。陈小康,一位专注于多模态技术的研究员,在X平台上发布了一条动态:“Now, we see you。”在该帖子中,DeepSeek的标志性鲸鱼图案被去除了眼罩装饰。不久之后,用户们发现DeepSeek网站上悄然推出了“识图模式”功能。这一新模式允许用户上传图片,并由模型进行内容识别和分析。不过,这项服务目前仅对部分用户开放测试,尚未全面推广。实际上

科技3 阅读
商汤革新多模态技术:摒弃传统VE与VAE架构中的中间编码器

商汤革新多模态技术:摒弃传统VE与VAE架构中的中间编码器

多模态大模型的研发方式正在经历全面革新。 今天,商汤科技与南洋理工大学共同发布了最新技术成果NEO-unify。 这是一个实现了“原生、统一、端到端”的多模态架构,其最突出的创新在于: 彻底摒弃了传统的视觉编码器(VE)和变分自编码器(VAE)。不再依赖组件拼凑来完成感知与生成任务,而是直接以近乎无损的形式处理像素和文字。 通过独特的混合变换器(Mixture-of-Transformer, Mo

AI25 阅读
科大讯飞推出定制化学习机,助力大模型融入实际应用

科大讯飞推出定制化学习机,助力大模型融入实际应用

最近,中国的人工智能企业在更新迭代方面动作频频。春节期间,字节跳动和阿里巴巴相继推出了多模态技术创新成果,其中Seedance 2.0引发了全球范围内的广泛讨论。作为国家层面的大模型研发团队,科大讯飞也一直活跃在人工智能应用的第一线。在新年之前发布了星火X2大模型以展示其核心技术升级后,该公司又于2月28日推出了新的AI学习机T90系列,进一步加快了人工智能技术向实际应用的转化。这些发布背后体现了

科技5 阅读