• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni

阿里深夜炸场!通义千问发布新一代端到端旗舰模型 Qwen2.5-Omni

2025 年 3 月 29 日
全线大跌!碳酸锂供应端扰动不断

全线大跌!碳酸锂供应端扰动不断

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
【财经分析】金价回调、油价反弹 「金油比」有望迎来回归?

【财经分析】 金价回调、油价反弹 「金油比」 有望迎来回归?

2025 年 11 月 5 日
广告

政策定调加快建设新型能源体系,储能电池 ETF(159566) 获资金持续布局

2025 年 11 月 5 日

美政府停摆追平历史最长纪录!两党互撕何时休?

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

多家大行黄金积存业务暂停又恢复 有机构提示 「追高」 风险

2025 年 11 月 5 日
网易云音乐推出大模型音效「AI调音大师」

网易云音乐推出大模型音效 「AI 调音大师」

2025 年 11 月 5 日
全线下挫!纳指跌超2%,加密货币超40万人爆仓;印度富豪逾8亿美元资产遭查封;马斯克万亿薪酬,重大利空;2026年节假日安排公布丨每经早参

全线下挫!纳指跌超 2%,加密货币超 40 万人爆仓;印度富豪逾 8 亿美元资产遭查封;马斯克万亿薪酬,重大利空;2026 年节假日安排公布丨每经早参

2025 年 11 月 5 日
「黑天鹅」突袭 华尔街投行警告!加密货币闪崩,金银铜齐跌

「黑天鹅」 突袭 华尔街投行警告!加密货币闪崩,金银铜齐跌

2025 年 11 月 5 日
「月薪万元,不敢吃麻辣烫」?杨国福「28.8元豆芽」上热搜

「月薪万元,不敢吃麻辣烫」?杨国福 「28.8 元豆芽」 上热搜

2025 年 11 月 5 日

中信建投:新政落地后或影响三类黄金市场参与者行为

2025 年 11 月 5 日

2008 年魅影再现?瑞银警告:数万亿美元保险业埋雷!

2025 年 11 月 5 日
金桂财经
广告
2025 年 11 月 5 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

阿里深夜炸场!通义千问发布新一代端到端旗舰模型 Qwen2.5-Omni

来自 金桂财经
2025 年 3 月 29 日
在 外汇
0

YOU MAY ALSO LIKE

拨款法案再次 「闯关」 失败 美政府即将刷新 「停摆」 纪录

美国参议院未通过拨款法案 联邦政府 「停摆」 将破纪录


K图 09988_0]

K图 BABA_0

  北京时间周四凌晨,阿里巴巴发布通义千问系列的最新旗舰模型 Qwen2.5-Omni。这款端到端多模态模型专为广泛的多模态感知设计,能够处理文本、图像、音频和视频等多种输入,同时能够通过生成文本和合成语音提供实时流式响应。

  据 「通义千问 Qwen」 官方微信号介绍,这款模型的主要特点如下:

  全能创新架构:Qwen 团队提出了一种全新的 Thinker-Talker 架构,这是一种端到端的多模态模型,旨在支持文本/图像/音频/视频的跨模态理解,同时以流式方式生成文本和自然语音响应。Qwen 提出了一种新的位置编码技术,称为 TMRoPE(Time-aligned Multimodal RoPE),通过时间轴对齐实现视频与音频输入的精准同步。

  实时音视频交互:架构旨在支持完全实时交互,支持分块输入和即时输出。

  自然流畅的语音生成:在语音生成的自然性和稳定性方面超越了许多现有的流式和非流式替代方案。

  全模态性能优势:在同等规模的单模态模型进行基准测试时,表现出卓越的性能。Qwen2.5-Omni 在音频能力上优于类似大小的 Qwen2-Audio,并与 Qwen2.5-VL-7B 保持同等水平。

  卓越的端到端语音指令跟随能力:Qwen2.5-Omni 在端到端语音指令跟随方面表现出与文本输入处理相媲美的效果,在 MMLU 通用知识理解和 GSM8K 数学推理等基准测试中表现优异。

  模型性能方面,Qwen2.5-Omni 在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如 Qwen2.5-VL-7B、Qwen2-Audio 和 Gemini-1.5-pro。

  在多模态任务 OmniBench,Qwen2.5-Omni 达到了 SOTA 的表现。此外,在单模态任务中,Qwen2.5-Omni 在多个领域中表现优异,包括语音识别 (Common Voice)、翻译 (CoVoST2)、音频理解 (MMAU)、图像推理 (MMMU、MMStar)、视频理解 (MVBench) 以及语音生成 (Seed-tts-eval 和主观自然听感)。

image

  该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 上开源开放。

(财联社)

文章转载自 东方财富

Search

没有结果
查看所有结果

一周热门

全线大跌!碳酸锂供应端扰动不断

全线大跌!碳酸锂供应端扰动不断

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
【财经分析】金价回调、油价反弹 「金油比」有望迎来回归?

【财经分析】 金价回调、油价反弹 「金油比」 有望迎来回归?

2025 年 11 月 5 日

政策定调加快建设新型能源体系,储能电池 ETF(159566) 获资金持续布局

2025 年 11 月 5 日

美政府停摆追平历史最长纪录!两党互撕何时休?

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

多家大行黄金积存业务暂停又恢复 有机构提示 「追高」 风险

2025 年 11 月 5 日
网易云音乐推出大模型音效「AI调音大师」

网易云音乐推出大模型音效 「AI 调音大师」

2025 年 11 月 5 日
全线下挫!纳指跌超2%,加密货币超40万人爆仓;印度富豪逾8亿美元资产遭查封;马斯克万亿薪酬,重大利空;2026年节假日安排公布丨每经早参

全线下挫!纳指跌超 2%,加密货币超 40 万人爆仓;印度富豪逾 8 亿美元资产遭查封;马斯克万亿薪酬,重大利空;2026 年节假日安排公布丨每经早参

2025 年 11 月 5 日
「黑天鹅」突袭 华尔街投行警告!加密货币闪崩,金银铜齐跌

「黑天鹅」 突袭 华尔街投行警告!加密货币闪崩,金银铜齐跌

2025 年 11 月 5 日
「月薪万元,不敢吃麻辣烫」?杨国福「28.8元豆芽」上热搜

「月薪万元,不敢吃麻辣烫」?杨国福 「28.8 元豆芽」 上热搜

2025 年 11 月 5 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 全线大跌!碳酸锂供应端扰动不断
  • 公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整
  • 【财经分析】 金价回调、油价反弹 「金油比」 有望迎来回归?
  • 政策定调加快建设新型能源体系,储能电池 ETF(159566) 获资金持续布局
  • 美政府停摆追平历史最长纪录!两党互撕何时休?
  • 多家大行黄金积存业务暂停又恢复 有机构提示 「追高」 风险
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }