计算体系结构,AI的AI比赛中的下一个分水岭
栏目:行业新闻 发布时间:2025-07-06 08:46
当DeepSeek宽广的人被剥夺时,AI竞争的重点从“ AI正确使用”转变为“如果AI正确使用?”目前,与是否可以正确使用DepSeek相比,如果可以正确使用DepSeek,则已成为企业关注的话题。通过大大降低大型模型部署的成本,DepSeek避免了数千个行业中AI应用的爆炸。根据国家数据局揭示的数据,在2024年初,中国的平均天日至日消费量为1000亿。虽然越来越多的公司在劳动环境中采用诸如DEPSEK之类的深层理解模型,但ATHE算法级别的差距很狭窄,并且在各个行业中,AI竞争的重点已经从“如果使用适当地使用AI?”。 “如果适当使用AI”。在2025年,该模型的优化关于技术的最终用途,应从模型级别算法到基础硬件资源的最终使用来优化技术。与基础软件和硬件的协同效率有关的深水竞争已经悄悄地开始。在AI基础架构中,连接到基础硬件和上部AI框架的计算体系结构一直是下一阶段实现AI的关键。深开放式Astron Computing Architecture CANS成为夺取工业AI有效实施的新支点。 01 Trend Change: AI competition fell into the leading position of mOdelo Deepseek in deep water of "system efficiency" is a series of model optimization technologies, including MOE, dynamic sparse computing, adaptive parameter optimization, multi-head potential attention mechanism (MLA), parameter balancing technology without technical loss, multi-word Meta prediction method, and andBP.在AI培训中,可以实现相同的表现以GPT-4的百分比,进一步降低了AI应用程序的阈值。与DeepSeek连接的所有公司都可以直接开展最有利的技术,以优化模型结构并获得相同的祝福。但是,如果您想最大限度地提高这些技术的价值并进一步提高理解效率,则必须依靠基础资源的系统优化。它应该提及行业NG计算的护城河 - 计算体系结构。如果将AI技术堆栈与多层蛋糕进行了比较,则自下而上是:XPU硬件层驱动的层计算架构层ai框架层层 - ai模型层aigai应用程序层。计算体系结构在连接过去和未来方面起着关键作用。向下,与GPU,NPU,XPU等异质处理器兼容;向上,连接到主要AI框架,计算体系结构是抓住基础H的效率的主要平台ardware并促进切割开发。底层计算体系结构似乎远非AI上限应用程序,但实际上,计算体系结构是与下一个节点中AI应用程序效率竞争的关键。计算体系结构就像建筑基础。当粉底处于足够的状态时,可以支撑更高,更稳定的摩天大楼。在全球计算行业中,很少有能够开发计算体系结构并逐渐开发生态系统的公司。计算体系结构通常涵盖基本组件,例如编程语言,运营商的库,编译器等,以及围绕这些组件进行优化的大量基础技术,每种都需要大量的研发投资,我们可以继续维持技术领导。在AI的全球场景中,长期以来,Ascend一直是AI变化的力量,无法忽视。 Astndant异源计算体系结构Cann(计算拱门神经网络的ITECTER)是Astendant AI的主要软件平台。一方面,Cann可以在所有硬件系列中最大程度地提高基础攀登的性能,从而极大地优化了顶级模型的性能,并加快了数千个行业的AI实施效率。另一方面,通过深刻的开放方法,CANT还为Deep AI开发人员提供了切割变化的空间,并与合作伙伴一起进入了模型性能的非管理模型,这已成为AI行业集成变化的机器。通过更深入地进入AI行业的全球连锁店,开放的深刻方法的价值仍在增强。 ASCEND AI基本软件和硬件平台02软件和硬件协作 +分层开放性牵引着AI,在千分行业中实施数千个具有AI应用程序方案的行业,如果您想提高理解的效率,建筑计算可以播放很多变化的空间。目前,Ascend Cann探索了一套完整的基础技术,用于优化和资源方法,这些技术可以提高使用计算能力和模型效率的效率,并在许多行业(如互联网,运营商,教育和科学研究以及制造业)中已成功证明。首先,在AI应用程序过程中,对诸如强烈绩效和超低延迟等场景的基本资源的一般优化是对绩效和延迟较低的无限需求,尤其是对于Internet,运营商和其他具有大量用户以及与Internet,运营商,运营商和其他行业的运营商和其他行业的需求。借助三个主要的硬件来源:计算,通信和内存,CANN可以提高使用基础资源的速度。在计算级别,长期的预处理阶段潜在的关注(MLA)涉及20个数据运动和13个串行计算运算符。 Mlapo Fusion操作员技术建议的Cann推荐包括大型操作员中的许多小型操作员,可以将计算时间从109微秒降低到45微秒。这项技术是在领先的互联网和运营商客户上实施的,并带来了20%的性能提高。在沟通层面上,MOE模型涉及专家之间的大量通信。 Cann使用NPU直接交流算法来现代化,与传统的RDMA通信相比,沟通时间的消费减少了90%。这项技术导致了大型Iflytek Spark模型的跨机器通信的延迟,该模型下降了90%,中国移动Kilocard通信的效率增加了50%。在记忆层面,Cann的多地点多地址技术通过修复我的记忆使用增加了20%莫里。其次,对于剪裁AI开发领域,Cann通过分层开放解决了发展效率和适应问题。教育/研究行业是AI尖端AI开发的主要力量,但它通常面临着诸如发展效率低的疼痛点和在适应heperenenitos的资源方面的难度。普通开发人员只需要致电运营商的库来满足一般的发展需求,但是更多的发展需求和深层开发需要持续的计算架构开放资源以实现。分层开放性是最重要的技术技术之一。在Ascend C编程语言,AOL操作员加速库和HCCL Collection Communication库的开放语言来源之后,Cann仍在今年打开GE Graph Engine,打开Bisheng编译器和运行时运行时,以满足恋人的最终需求。 Tsinghua University项目地图团队建立了一个特定于MoE的操作员基于CANN的系统,并导致基于单个服务器ng上升的DeepSeek R1模型布局成功。此外,提供提高发展效率的成熟工具始终是Cann重复的重点。今年,Cann推出了一个新的Catlass操作员模板库,提供了各种各样的操作员示例。南中国中国技术团队在Catlass操作员模板图书馆的帮助下开发了数学运营商,并且该周期的开发从传统的4年周到2年。第三,罐子是分层和开放的。对于在AI部署开发方面遇到困难的传统行业,Cann Partners将加速行业解决方案的实施。对于制造和医疗保健等传统行业,Deptseek仍然具有特定的阈值。 DeepSeek多合一机器,垂直行业模型等代表的实施解决方案可以简化扩展和加速AI在传统行业中的应用过程。 Ascend推出了大量的Deptseek解决方案,并向该行业的500多个客户推出了。例如,在家庭纺织行业中,传统的绘画设计过程太长了,这是一种影响新研究和产品开发效率的瓶颈。以前,需要手动设计绘画,织物选择,样品制作和样品射击花了20天以上的时间,并且需要重复进行更改。基于Cann开放性和基本滴虫功能的深度功能,Ascend Partners Textiles Technology开发了中国的第一个家用面料模型。设计师只需要输入简单的图片和描述,而家用织物模型则具有相同数量的美学和商业价值的样品设计,从而将设计成本从10千元降低到十二元,并将设计周期从20天减少到5天。03生态开放结合了整个AI产业链的现代机器。随着AI技术继续加速变化,AI行业的流动变得越来越大且复杂,无法用一种或多种巨型技术来覆盖它。开放性的深度和程度也是计算体系结构的主要竞争。对于Cann来说,深入开放既是技术方法,又是一种生态方法。借助深厚的开放性,Cann逐渐成为一台机器,并结合了改变整个AI产业链的力量。首先,NWE与我们的合作伙伴合作,创建一个涵盖整个AI执行周期的更开放和方便的AI基础架构生态系统。例如,在运营商开发的层面上,根据Cann的深刻开放,高性能运营商库可以使30多个客户/合作伙伴能够构建260多个核心操作员。这些主要运营商适应了更广泛的行业场景,这进一步降低了企业AI的应用阈值。在操作系统层面,Cann与合作伙伴联手将兼容性与五个主要的国内系统(例如Hongmeng,Ora和Kirin)联系起来。在培训级别/伸展水平上,CT允许将10个以上的AI基础设施公司在内,包括腾讯,基于硅的流,Wuwenxinqiong等,以创建MA MASUMMARY套件,例如智能调度机和分布式培训框架,使AI更好。其次,与合作伙伴一起伴随基本模型的切割变化。近年来,基本模型的绩效突破以及基础资源的优化表明了关于双向发展的讨论。以Astron和Iflytek为例,一方面,计算的体系结构有助于对模型性能的最终探索。例如,基于深度开放的罐头,Iflytek领导了实施的实施对升天MOE模型的理解的离子,实现了对上升集群中MOE模型的大规模验证的首次重大验证,从而达到了3.2倍的一般吞吐量,并减少了50%的端到端延迟。另一方面,在模型的性能期间,基础软件和硬件协调也有所改善。例如,Iflytek还参与了Asteng生态系统的构建,该系统促进了Asteng开发工具工具的持续丰富。第三,Pytorch和VLLM等全球主流AI开源生态系统的合作继续增强。近年来,Ascend继续与第三方开放生态系统合作,并深深地嵌入了AI开源的全球生态系统中。目前,VLLM已成为开发人员最受欢迎的娱乐引擎之一。在2024年下半年,Asent开始与VL进行技术和生态合作LM。 VLLM社区的新版本已发布,并在发布时支持分页上的添加,为开发人员提供了许多选项。上升团队还帮助VLLM社区开发了硬件后端功能,以降低社区维护成本以进行后端支持。结论,当模型性能突破和基础资源越来越多地集成时,建筑计算已从技术的后部转移到行业领导者。从在建筑师心目中继续迭代的代码降低成本和提高实际业务状况的效率,Cann在数千个行业的AI职业中起着重要的价值。当企业AI企业应用程序进入深水时,开放和创新的Cann成为AI行业独立和受控链的脊柱。 Artikulo的起源:智能进化论