
中国科技巨企阿里巴巴星期二(4月29日)凌晨发布并开源新一代通义千问模型Qwen3(简称千问3)。
综合第一财经、澎湃新闻和路透社等报道,千问3模型家族是中国首个混合推理模型系列,将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。
在本次开源的系列模型中,旗舰模型Qwen3-235B-A22B的总参数量为235B,DeepSeek-R1的三分之一,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。
阿里巴巴今年1月发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。
3月,阿里巴巴发布Qwen系列人工智能新模型,称该模型可处理文本、图片、音频和视频,可以直接在手机和笔记本电脑上运行。
中国互联网巨头百度发布新一代文心一言模型4.5 Turbo和X1 Turbo,能同时处理文字、视频等多种类型数据。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。