DeepSeek更新V4版AI模型 推理速度最高提升85%

中国人工智能(AI)初创公司深度求索(DeepSeek)更新了最新的V4版本AI模型,将模型推理速度最高提升了85%,同时大幅降低了部署成本。

综合华尔街见闻和IT之家报道,DeepSeek星期六(6月27日)更新了V4版本,推出推测解码(Speculative Decoding)框架DSpark,并开源了全栈工具DeepSpec。

DeepSeek-V4-Pro-DSpark并非全新架构模型,而是在DeepSeek-V4-Pro的基础上引入了推测解码模块。因此,此次更新的重点在于工程落地,而非模型能力本身的迭代。

推测解码是一种在不影响模型输出结果的前提下,有效提升推理效率的技术。该技术先由轻量级模型预先生成候选内容,再交由主模型进行验证,从而加快大型语言模型(LLM)的推理速度。

DeepSpec则是用于训练与评估推测解码草稿模型(Draft Model)的完整开源工具,包含数据准备、模型训练、草稿模型实现及性能评估等功能。这可协助研究人员直接训练推测解码模型,大幅降低部署门槛。

根据DeepSeek创始人梁文锋与北京大学共同发表的论文,将DSpark部署在DeepSeek-V4线上服务系统中并在真实用户流量环境下运行,可有效减少因无效验证而造成的算力浪费。

相较于既有的生产环境基准方案,DSpark在相同吞吐量下,可将单一用户的生成速度提升60%至85%。

这是DeepSeek在完成500亿元人民币融资后,率先在AI推理效率优化领域推出的成果。这显示该初创公司除了聚焦提升模型能力,也力图在算力效率竞争中取得优势。

目前,中国企业所开发的AI模型正朝着高性能、低成本的轻量化方向发展,这一趋势正动摇美国企业长期以来的主导地位。

彭博社报道,OpenRouter的数据显示,截至今年6月,向谷歌、OpenAI和Anthropic模型发出的词元(Token)请求份额,已从一年前的72%大幅降至33%;而截至3月,中国AI模型的份额已攀升至60%以上。

推动中国AI模型使用率剧增的一大主因,正是它们相较于美国模型所具备的显著性价比优势。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。