
当大模子竞赛从“参数武备”转向“应用落地”,一个闭塞而高增长的底层生意正在浮出水面——“Token工场”(把东说念主工智能智商拆解成最基础的计量单元“Token词元”,像自来水厂雷同按需供应)。
6月16日,国内AI(东说念主工智能)推理就业企业“硅基流动”官宣完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模子即就业)赛说念最大单笔融资记录。《逐日经济新闻》记者了解到,这家竖立不及三年的企业,曩昔一年日均Token隐约量达数万亿量级,营收同比涨超十倍,还曾在11个月内连获三轮融资,成为一级市集炙手可热的方向。
无非常偶,5月,同赛说念企业无问芯穹、魔形智能纷纷晓喻融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。截止4月底,无问芯穹AgenticMaaS大模子就业平台的日均Token调用量相较于旧年底已增长超20倍。
成本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与MaaS就业、全行业API(应用法式编程接口)订价堕入尖锐化竞争、端侧轻量化模子捏续分流云表Token调用需求。多重挤压之下,“Token工场”深广堕入业务范畴高速膨胀、盈利空间不断收窄的矛盾场面,奈何走出增收不增利的困局成为赛说念中枢议题。
产业成本扎堆入局“Token工场”成AI落地中枢赛说念
一笔20亿元级融资,将“Token工场”赛说念再次推至聚光灯下。
据硅基流动官方裸露,本轮融资由携程战投、晶科动力控股、金蝶股份、联通新沃、盛奕成本(津润集团产业成本)、壁仞战投、蔚来成本、商汤战投、巨东说念主网罗等二十余家机构长入投资。至此,硅基流动已赢得动力、芯片、算力基础步骤、云就业、大模子及场景应用等AI全产业链企业投资,产业成本在本轮融资中占比显赫普及。

这并非赛说念首笔大额融资。本年5月,同赛说念玩家无问芯穹刚完成超7亿元融资;国外市齐集,FireworksAI竖立四年打算估值达150亿好意思元,日处理Token范畴15万亿。短短一年时辰,“Token工场”已从AI产业链边际法子,跃升为一级市集的中枢赛说念。
成本热捧的底层逻辑,是AI需求结构的根人性切换。
大模子智商每迈上一个台阶,就解锁一大类应用,应用反过来又普及了底层Token销耗量。据国度数据局相干数据,2024年头中国日均Token调用量为1000亿;至2025年底跃升至100万亿;本年3月已坑害140万亿,两年增长超千倍。
宇宙有名商榷机构IDC最新发布的《中国AI软件市集半年度跟踪,2025H2》数据显露:2024年中国企业级MaaS市集调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS市集范畴达30.7亿元,增速远超AI行业举座水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在捏续推高Token销耗范畴。

IDC预测,2026年中国MaaS市集的Token销耗量将达到40000万亿,较2025年再增约20倍。
从贸易模式本体来看,Token工场并非浅陋的算力转售,中枢是将芯片适配、模子部署、推理引擎调优、异构算力调节等复杂工程智商,封装为尺度化API接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重进入,大幅裁减了AI落地的手艺门槛与成本周期。
面对海量的市集需求爆发,大范畴、高性价比Token的镇定供应,正成为影响AI手艺范畴化落地的要道智商。
天神投资东说念主、资深东说念主工智能人人郭涛经受《逐日经济新闻》记者采访时暗意,从“卖模子”到“卖Token”是AI产业贸易化的焦灼演进。Token手脚大模子处理信息的最小单元,具备可计量、可订价、可来回的性格,将AI智能智商滚动为可尺度化来回的巨额商品,处置了AI智商难以量化的行业痛点,鼓动行业从定制化就业模式转向尺度化、范畴化变现模式,耐久来看这门生意具备较好的可捏续性。
中金公司研报显露,“Token工场”模式已成为宇宙大模子厂商的主流贸易化旅途,国外头部企业Anthropic年度凡俗性收入坑害300亿好意思元。盈利层面,刻下国外头部大模子API业务毛利率深广在40%至50%,国内大模子厂商MaaSAPI业务毛利略低于国外,展望本年将达到20%至40%,跟着范畴效应开释与手艺优化,耐久仍有上行空间。
大厂下场、API价钱战尖锐化、端侧AI快速普及⋯⋯“Token工场”盈利承压
不外,头部企业营收十倍增长的亮眼数据背后,赛说念隐忧耐久存在。跟着互联网大厂下场布局、API价钱战尖锐化,“Token工场”的贸易模式鸿沟与增长天花板正被再行注目。
大厂亲身下场是最径直的行业变量。

6月8日,ag(中国)手机网阿里巴巴晓喻组织架构诊治,将通义大模子行状部与畴昔生活实验室整合,竖立全新TokenFoundry行状部,由集团CEO(首席履行官)吴泳铭径直崇敬。此前3月,阿里竖立ATH(AlibabaTokenHub)行状群,照旧喊出了“创造Token、运送Token、应用Token”的中枢打算。
将Token分娩普及至集团计谋级,背后是大厂对推理就业进口价值的重估:Token产能既是支捏自己电商、云就业、土产货生活等业务AI化的基础,亦然阿里云对外输出MaaS就业的中枢产能。
郭涛以为,大厂全面入场后,零丁第三方“Token工场”仍有生计空间。他向记者暗意,大厂虽有手艺、资源和生态上风,但市集需求千般且复杂,难以隐敝悉数领域和场景。零丁第三方可聚焦特定垂直领域提供个性化、定制化就业,或深耕特定手艺优化,针对某类模子或场景普及Token生成后果与质料。此外,部分企业出于数据安全、幸免过度依赖单一厂商的考量,也会采选与零丁第三方互助。
API价钱战捏续尖锐化,则是刻下“Token工场们”濒临的最径直盈利压力。
自2023年以来,头部大模子厂商已累计十余次下调API价钱,部分主流模子千Token价钱从当先的数毛钱降至几分钱,累计降幅超90%。穷乏中枢优化智商、仅靠算力差价盈利的中间商型玩家已率先堕入亏空。
北京PK10中国官方网站本年5月,DeepSeek官方晓喻V4-Pro模子API弥远降价,举座降幅75%,百万Token输出价钱为6元。随后,小米、腾讯云纷纷跟进,小米旗下MiMo-V2.5系列API弥远降价,最高降幅达99%,Pro版订价与DeepSeekV4-Pro王人备对王人。腾讯云自6月3日0时起,对DeepSeek-V4系列模子调用价钱进行大幅下调,最高降幅达到97.5%,诊治后价钱全面捏平DeepSeek官方售价。

业内深广以为,若“Token工场”后果普及的速率跟不上价钱下落速率,贸易模式的可捏续性将径直濒临挑战。
此外,端侧AI的快速普及,则从需求端分流市集。随入部属手机、PC(个东说念主电脑)等终局开辟的端侧大模子智商升级,深广轻量级推理任务向端侧迁徙,无需调用云表Token。行业深广预测,畴昔30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长迤逦文的中枢推理需求仍依赖云表,但端侧分流无疑收窄了云表“Token工场”的举座增长天花板。
与此同期,头部客户自建推理集群的趋势也在蚕食第三方市集份额。金融、动力、政务等数据明锐型行业出于合规考量,更倾向私有化部署;头部互联网企业跟着业务范畴扩大,自建算力集群的单元成本已低于第三方采购,纷纷转向自建。第三方“Token工场”的中枢客群,可能冉冉向中小企业、长尾应用与弹性需求场景纠合,市集定位濒临重构。
关于“Token工场”赛说念的泡沫争议,郭涛向记者暗意,当今市集如实存在一定泡沫迹象。深广成本涌入下,部分企业为追求范畴盲目膨胀,忽视履行成本与盈利情况。但举座而言,AI发展是势在必行,Token经济手脚其贸易化要道模式有着真确需求支捏,仅仅市集需要履历诊治与整合。
谈及破局旅途与行业终局,郭涛以为,“Token工场”可通过普及算力运用后果、优化能耗裁减运营成本,通过分级服求终了各异化订价获取溢价,还可配套模子优化冷落、手艺支捏等升值就业拓展收入起原。
“耐久来看,市集更可能酿成多头绪、各异化的竞争阵势:头部大厂凭借实力占据通用型大范畴市集,中小‘Token工场’凭借性格就业深耕细分领域,酿成错位竞争AG中国手机官方网页版,共同组成多元的市集生态。”郭涛暗意。

备案号: