华为轮值董事长徐直军：通过架构创新应对芯片制造工艺限制，不是每个企业都要训练自己的基础大模型

admin 2024-09-19 广州软文合集 33 次浏览 0个评论

　　新浪科技讯 9月19日下午消息，在今日的华为全联接大会2024上，华为副董事长、轮值董事长徐直军发表《拥抱全面智能化时代》的主题演讲。

华为轮值董事长徐直军：通过架构创新应对芯片制造工艺限制，不是每个企业都要训练自己的基础大模型

　　他表示，智能化必将是一个长期过程，算力是智能化的关键基础。而算力是依赖半导体工艺的，但我们必须要面对一个现实，那就是，美国在AI芯片领域对中国的制裁长期不会取消，而中国半导体制造工艺由于也受美国制裁，将在相当长时间处于落后状态，这就意味着我们所能制造的芯片的先进性将受到制约。这是我们打造算力解决方案必须面对的挑战。

　　立足中国，只有基于实际可获得的芯片制造工艺打造的算力才是长期可持续的。华为的战略核心就是，充分抓住人工智能变革机遇，基于实际可获得的芯片制造工艺，计算、存储和网络技术协同创新，开创计算架构，打造“超节点+集群”系统算力解决方案，长期持续满足算力需求。

　　他提到，大模型的技术突破大大加速了智能化的进程，一段时间以来，各行各业几乎言必称大模型，纷纷建设AI算力，纷纷训练大模型。这对于华为这样的算力提供商而言，无疑是重大利好。但从长远发展角度考虑，第一、不是每个企业都要建设大规模AI算力。AI服务器，特别是AI算力集群不同于通用x86服务器，对供电、散热等数据中心机房环境要求极高，且随着大模型越来越大，AI算力也将走向更大规模，而且变化节奏快，AI服务器快速升级换代，数据中心机房面临要么浪费、要么满足不了需求的困境。每个企业都要思考适合自己的获取AI算力的方式，而不仅仅是建设自己的AI算力。

　　第二、不是每个企业都要训练自己的基础大模型。训练出基础大模型，关键是数据，而准备足够多的高质量数据是很大挑战，基础大模型预训练数据量进入10万亿tokens量级，这对于企业来说，不仅意味着高成本，同时是否能获取到足够的数据量也是挑战。基础大模型参数量在持续增大，模型迭代和优化难度大，通常需要数月到数年时间完成模型迭代训练。每个企业都应聚焦自身核心业务，自行训练基础大模型会影响AI尽快赋能核心业务。

　　第三、不是所有的应用都要追求“大”模型。从华为盘古在行业的实践看，十亿参数模型可以满足科学计算、预测决策等业务场景的需求，比如降雨预测、药物分子优化、工艺参数预测，在PC、手机等端侧设备上，十亿参数模型也有广泛应用。而百亿参数模型可以满足面向NLP、CV、多模态等大量特定领域场景的需求，比如知识问答、代码生成、坐席助手、安全检测。面向NLP、多模态的复杂任务，可以用千亿参数模型来完成。

　　“所以我们认为，企业需要的是根据自身不同业务场景需求，选择最合适的模型，通过多模型组合，解决问题，创造价值。”

转载请注明来自富泽强科贸软文网，本文标题：《华为轮值董事长徐直军：通过架构创新应对芯片制造工艺限制，不是每个企业都要训练自己的基础大模型》

admin 82013篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

admin管理员

最新文章

华为轮值董事长徐直军：通过架构创新应对芯片制造工艺限制，不是每个企业都要训练自己的基础大模型

网站分类

热门文章

文章目录

admin管理员

最新文章

华为轮值董事长徐直军：通过架构创新应对芯片制造工艺限制，不是每个企业都要训练自己的基础大模型

60岁高龄孕妇成功分娩是一个非常罕见且令人惊讶的事件。这样的案例在全球范围内都是非常罕见的，因为高龄产妇面临着许多生理和健康上的挑战。，60岁高龄孕妇成功分娩，罕见而令人惊叹的奇迹

经济风暴的引爆点是一个复杂的问题，因为它涉及到许多因素，如全球经济形势、政策变化、技术进步、社会变革等等。因此，我无法预测下一场经济风暴的引爆点。，经济风暴的多元引爆因素分析

关于女子2年被家暴16次案择期宣判的报道，我了解到这是一起非常严重的家庭暴力案件，对受害者的身心健康造成了极大的伤害。，建议，女子遭2年家暴16次案择期宣判，严重伤害引发社会关注

中日达成10项共识是在2018年10月27日，中日双方就中日关系和共同关心的问题进行了磋商，并达成以下10项共识，2018年10月27日中日达成十项共识，共同推进中日关系与合作的里程碑

根据官方披露，有两名中将涉嫌严重违纪违法。，两名中将涉嫌严重违纪违法，官方披露引发关注

俄乌冲突的结束时间是一个复杂的问题，涉及到许多因素，包括政治、军事、经济和地缘政治等多个方面。因此，无法准确预测俄乌冲突将于何时结束。，俄乌冲突结束时间，多因素交织下的复杂问题

网站分类

热门文章

文章目录