关键词搜索

国产大模型API大降价,降幅超90%,企业用户赶紧看

【金色港湾资讯网为您推荐阅读】

有一位名叫李明的初创 AI 应用开发者, 向本报记者透露, 他所在的团队从原本安排每月把 2 万元投入到调用某头部大模型 API 这件事上, 目的是用来去开发智能客服工具。然而呢在经历了本轮降价潮之后, 同样的预算之下能够调用的模型词元总量提高了将近 20 倍, 原本因为成本过高所以被搁置的这个实时语音交互功能, 现如今已经进入到测试阶段了。这样的一个案例反映出国产大模型价格战正在很大程度地深刻改变行业生态。这对于大模型 缓存 技术突破 化调 MiMo 滑动窗口 并行调度 技术优化 技术路径 显存来说非常重要。

降价动作密集出台

5月22日, 它率先宣告旗舰大模型V4 - Pro永久降价, 整体下跌幅度达到75%。其中, 输入侧缓存命中的单价降低到0.025元每百万词元,直接刷新了全球公开报价的最低纪录。这个价格比之前行业的平均水平下降了接近一个数量级, 让市场产生震动。

5天后, 小米紧急进行了跟进, 旗下MiMo - V2.5全系列的API永久降低了资费, 在部分场景当中降价比例接近99%, 成为了本轮降价潮里单次降幅最高的厂商 , 小米这次的举动被业内看作是抢抓中小开发者市场的战略举措。

腾讯云两轮调价跟进

于6月2日那一天, 腾讯云发布了一则公告, 自6月3日开始, V4全系列模型同步进行降价操作, 其最高降幅达到了97.5%。腾讯云清晰明确地做出承诺, 模型推理的速度、上下文窗口以及输出准确率等这些核心参数是不会改变的, 用户的使用体验不会受到影响。这一表态内含之意在于打消用户对于“降价降质”的那种担忧。

6月12日, 腾讯云推出了第二轮会有所区别不同的调价, 自研多语言翻译模型Hy - MT2 - Pro, 其输入词元费呈现出下调66.67%的情况, 输出词元费也出现了下调55.56%的现象, 而第三方模型 - M3, 定于6月15日统一进行下调三项费用的操作, 且降幅都是50%, 腾讯云的这种策略表明它注重去平衡自研与生态合作伙伴之间的利益。

逆势降价凸显技术底气

国产大模型API大降价,降幅超90%,企业用户赶紧看(图1)

需要予以关注的是, 这一轮的降价现象, 与上游算力市场的走势, 呈现出一种完全相反的背离态势。在2026年上半年期间, HBM内存的市场价格涨幅, 超过了500%这一比重, 英伟达的高端GPU产品, 长期处于供不应求的状况, 海外的亚马逊云和微软Azure, 已经开启了涨价的举措, 部分海外厂商的API涨幅, 高达463%这样一个数值。这种一涨一跌的反向走势情况, 突出显示了国产大模型竞争策略方面存在的差异。

广州艾媒数聚的CEO张毅, 向本报记者言说, 国内大模型这个行业, 已然走出了前期靠烧钱来尝试错误的阶段, 全面步入到商业化落地的攻坚时期。针对中小开发者以及垂直的小微企业, 这一轮的降价, 直接使得AI创业尝试错误的成本降低, 小众的创新团队, 其生存空间显著地拓宽了。

技术突破支撑降价空间

小米官方公布了MiMo模型降低成本的技术途径, 研发团队依据结构化生成语音框架配备缓存计划, 把KV缓存在三级存储间的时候, 数据转移量被压缩到原来的七分之一, 系统能够长期缓存的词元容量增大了五倍。另外, 借助优化混合专家模型并行调度的逻辑, 集群整体的吞吐效率明显提高。

就由模型架构以及算力国产化这两条途径来降低成本, 自行研发轻量化稀疏注意力机制并搭配动态混合专家结构, 致使V4系列模型在处理超长上下文之际, 算力消耗仅仅是上一代版本的27%, KV缓存显存占用被压缩了90%, 且同时达成的进行昇腾系列国产算力芯片深度适配, 从而摆脱对海外高端GPU的单一依靠。

行业竞争转向效率与生态

国产大模型API大降价,降幅超90%,企业用户赶紧看(图2)

看见这一回的降价情形, 使我由此联想到之前某一家海外的AI公司, 由于过度押注单一硬件进而陷入成本方面的困境, 它不得不接连多次提高价格, 最终致使大量用户流失。国产的大模型厂商凭借自主技术突破达成逆势降价情况, 恰恰是汲取了类似的教训, 从而把定价权牢牢掌握在自身手中。

站在普通开发者的立场去看, 这项技术革新所带来的最为直接的影响在于, 原本每个月要花费1万元才仅仅能够调用10万次API, 而如今在同样金额的情况下却能够调用将近百万次。这表明着, 个人开发者亦或是小团队都能够去尝试进行AI原生应用的开发, 以往唯有大公司才可以涉足的游戏, 现如今其门槛已经大幅度地降低了。

未来定价将两极分化

张毅作出预测, 在未来, 大模型价格定会呈现两极分化态势 , 基础推理服务, 会因具备技术迭代以及规模效应, 持续下降, 渐渐靠近公用事业定价 , 高端定制化服务, 将会维持溢价 , 行业竞争焦点, 正从算力堆砌, 转变为效率优化与生态构建。

拥有自主架构创新能量以及国产算力适配本事的企业有希望取得胜利, 然而缺少技术护城河的厂家会面临清理压力。对于开发者来讲, 此次降价的时间段或许是谋划人工智能应用的最好时刻, 可是要提防部分厂家后续有可能凭借限定服务参数转而抬高价格。

要是你身为一名开发者, 当遭遇 API 价格大幅下降这种情况时, 你究竟会抉择马上入场去开发新产品, 还是会持续观望进而等待更低的价格? 欢迎于评论区去分享你的看法, 点赞并且转发此文章, 以使更多人知晓这一行业变革。

更多精彩文章请关注=>金色港湾资讯网 www.fzjsgw.com

分享更多
0

您可能还会对下面的文章感兴趣: