太初元碁洪源:异构计算能力将成为未来AI算力基础设施的重要方向|AIGC2026
2026年,AI产业正步入一个全新的高强度算力周期。这并非空谈,而是由Agentic AI、代码助手、智能办公等应用加速落地所驱动的现实。AI正从演示走向真实任务,而“Token”也随之成为这个时代最核心的资源消耗单位。
于是,一个关键问题浮出水面:我们的算力,能否支撑起未来更高频、更复杂的AI应用?这直接关系到整个产业下一阶段的走向。正如太初元碁首席产品官、高级副总裁洪源在量子位AIGC2026峰会上所强调的,在Token经济加速到来的背景下,AI算力必须更好地向上兼容框架、模型与应用,为大模型的训练、推理乃至行业落地,提供更稳定、高效且易用的基础支撑。
伴随大模型能力跃迁和AI应用激增,Token调用需求正持续释放,这无疑为国产算力带来了新的发展机遇。一个清晰的趋势是:未来的算力,将不再仅仅是模型训练背后的默默付出者,而是会贯穿从模型研发、应用部署到行业场景落地的全链路,成为Token智能时代最关键的新型基础设施。
为了更完整地呈现这一思考,以下是对洪源演讲核心观点的梳理与展开。
核心观点梳理
- 随着Agentic AI、行业大模型和智能应用深入真实业务场景,AI计算正从“生成内容”迈向“生成任务”。这对算力系统的稳定性、效率和协同能力提出了前所未有的高要求,未来需要解决的核心是多种计算单元间的配合、协同调度,以及降低等待与通信成本。
- 国产AI算力迎来新机会,但真正的突破点已不在单点性能,而在于大规模集群服务能力、整体计算效率和生态易用性。
- 大模型训练与推理正走向万卡乃至更大规模集群,算力厂商需从硬件、互联、软件、调度、运维等全链条提升系统能力。
- Agent任务执行中,CPU调度、GPU计算、通信和数据处理等环节需高效协同,异构计算能力将成为未来AI算力基础设施的重要方向。
- 未来AI算力将如同Token经济中的“制氧机”,持续为模型、应用和行业场景的运行提供生命线。
Token经济加速到来,国产AI算力迎来新机遇
自2022年底ChatGPT发布以来,大模型行业的迭代速度有目共睹。尤其今年以来,主流模型的更新频次更是快马加鞭。这对算力厂商意味着什么?意味着必须持续围绕主流大模型进行适配和优化。
无论是模型数量、训练数据规模,还是所需算力与模型参数本身,增长趋势都异常显著。在此背景下,“Token经济”成为今年行业的热议话题。随着大语言模型调用量激增,
Token正成为AI时代核心的消耗单位,国产模型的相关调用量也在持续攀升。
从OpenRouter等机构的预测数据看,从2025年到2026年,再到2030年,整体Token调用量预计将出现惊人的增长,增幅可能达到212倍。可以预见,未来无论是消费级应用还是企业级行业应用,都将带来规模空前的Token消耗。
Token调用快速增加的同时,AI应用市场也在同步扩张。越来越多的应用正走向真实场景,办公、编程、医疗、教育、能源、电力等行业都在加速引入AI能力。这直接指向一个结论:
底层算力基础设施,必须能够支撑更高频、更复杂、更大规模的AI调用需求。
有趣的是,算力效率的提升并不会减少需求,反而会进一步释放它。生产效率提高后,应用场景会增多,调用频次会增高,最终带来的,是算力需求的持续螺旋式上升。
根据IDC及国内调研机构的数据,到2030年,全球算力规模预计将以每年约60%的速度增长,而其中超过90%都将是智能算力。对于国产AI算力而言,这无疑是一轮至关重要的战略机遇。大模型能力增强、Token需求释放、行业应用落地,三者合力,正将国产算力推向更广阔的产业舞台。
大模型进入任务时代,AI算力需要解决三大关键问题
机遇固然巨大,但挑战也同样明确。站在新的起点上,国产AI算力需要攻克几个关键问题,主要集中在以下三个方面。
首要问题是
大规模集群的服务能力
其次是
计算效率
未来的AI算力系统,必须更好地发挥不同计算单元的协同效率
第三个问题是
生态
一句话总结,
AI算力的发展早已过了单纯“堆性能、堆算力”的阶段。
从超算积累到生态适配,打造AI产业「制氧机」
面对这些挑战,行业已在积极行动与探索。以太初元碁为例,其路径体现了从技术积累到生态构建的系统性思考。
首先,在
大规模集群
其次,在
异构计算
此外,
生态建设
洪源用一个生动的比喻总结了算力的新角色:Token经济到来后,算力对于AI产业,就如同氧气之于人类。而他们正在建设的新型基础设施,目标就是成为那个持续、稳定供氧的“制氧机”。其长期使命,正是与产业伙伴协同,整合上下游资源,共同为中国AI产业提供稳定、高效、自主可控的新型算力基础设施。