环球网校是美国纳斯达克上市企业欢聚时代(NASDAQ:YY)旗下品牌 | 住房和城乡建设部 建筑人才培训合作单位
您现在的位置在: > 建筑考试 > 一级建造师 > 考试动态 >

2024 年第 6 届北京智源大会倒计时 11 天,聚焦 AI 系统全栈创新

2024-10-10 来源:网络 作者:佚名

2024年6月14日至15日,第六届北京智源大会将以线下与线上相结合的方式举行。线下会场设在中关村国家自主创新示范区会议中心。 2024年致远会议再次汇聚了具有全球视野的年度优秀研究人员,交流新思想、探索新思想、引领新前沿。报名通道现已正式开通。 #

北京致远大会倒计时:11天 #

人工智能系统论坛| 6月15日上午 #

智源大会一年一度的人工智能系统论坛是一场科技盛会,吸引了全球人工智能系统领域最知名的技术创新者和高影响力成果的领导者参与。随着大模型对算法、算力和数据的需求持续快速上升,多样化的芯片架构不断涌现,AI系统技术面临前所未有的挑战,全栈技术因此受到广泛关注。 #

本届论坛将聚焦AI系统全栈创新,涵盖算子和AI编译器、并行框架优化、超大规模AI集群网络架构优化等关键领域。同时我们也会深入研究不同芯片架构下的AI加速技术。通过本次论坛,我们希望汇聚顶尖智慧,共同推动AI系统技术的突破与发展,引领未来技术变革。 #

论坛议程 #

论坛主席 #

林永华 致远研究院副院长兼总工程师

#

林永华现任北京致远人工智能研究院副院长、总工程师,分管大模型研究中心、人工智能系统及基础软件研究、产业生态合作等重要方向。 IEEE女工程师亚太领导小组成员、IEEE女工程师协会北京分会创始人。曾担任IBM中国研究院院长,也是IBM全球杰出工程师,领导IBM内部全球人工智能系统的创新。从事系统架构、云计算、AI系统、计算机视觉等领域研究近20年。我拥有 50 多项全球专利,并多次获得 ACM/IEEE 最佳论文奖。被评为2023年福布斯中国50位科技领军女性之一。

#

演讲主题及嘉宾介绍(按发言顺序)

#

1. 人工智能:(在线)

#

报告简介:在此,我的AI,进入了他们的和。作为人工智能驱动,GPU、TPU、NPU、FPGA 和 ASIC 等人工智能的应用,如、、JAX、、、IREE 和 MLIR。我将介绍这一点、以及在人工智能中的作用。将了解如何利用这些工具来推动人工智能,使其处于边缘。 #

David,IBM,STSM 公开赛

#

David 曾参与 GNU 的 Open 和 Linux、IBM 的 Linux 以及 AI 的工作。 David 是一名 ACM 并拥有博士学位。在 。

#

2.人工智能系统领域还有哪些重要问题? #

报告简介:大型模型的普及给AI系统带来了一系列新问题。例如,迫切需要提高大模型推理的效率,而一些过去重要的问题已经不再重要。学术界和工业界的人工智能系统从业者都在思考人工智能系统领域还有哪些重要的未解决问题。报告将分享团队对此问题的思考和实践。 #

袁锦辉,硅谷移动创始人

#

袁锦辉,2003年获西安电子科技大学计算机科学学士学位,2008年获清华大学计算机系工学博士学位,优秀博士论文奖获得者清华大学学士。 2008年至2011年在清华大学博士后期间开展计算神经研究。 科学研究,2013年至2023年担任微软亚洲研究院首席研究员(Lead),负责开发大规模机器学习系统和服务微软产品。 2023年至2023年,他发起并领导了开源深度学习框架的开发,朝着分布式深度学习系统编程的易用性和高效性方向设计了一系列新方法,并被业界广泛采用。目前研究领域为人工智能,致力于通过算法、系统、硬件协同设计开发大模型推理加速引擎,降低大模型应用成本和开发门槛。 #

3.通用算子库 #

报告简介:大模型的流行是一种新型的AI算子开发语言。由于它比CUDA、HIP等加速编程模型更容易编程,因此近年来在AI领域非常流行。在多种算力并存的时代,它开源、开放、易于开发,有潜力成为真正统一多种后端的高效算子编程工具。但目前缺乏基于开发的通用算子库,官方支持的后端硬件也非常有限。鉴于此,致远联合多家厂商共同开发算子库,为大模型训练提供通用、广泛、跨后端的算子支持。运营商图书馆情报发布会正式发布。本次分享将介绍运营商库的研发背景、关键技术、性能数据以及多后端支持。

#

白同欣 致远研究院研究员

#

负责AI算子库和编译器。加入致远之前,曾就职于百度飞票、西门子中国研究院、中科院深圳先进技术研究院、H2O、H2O。他的研究兴趣包括深度学习框架、并行编程和编译器以及分发。配方数据库和机器学习系统,博士在计算机科学中。 #

4.深度学习编译:从定制资源分配到高性能代码生成 #

报告简介:深度学习编译系统在计算图划分、算子优化、代码生成等多个阶段形成了统一的编译流程。对于深度学习的编译系统,本报告将首先介绍如何利用深度神经网络的模型特性来实现调度,以获得更好的资源分配方案,提升硬件资源利用率。接下来,本报告将介绍深度学习编译中层和算子层优化的实现方案,并探讨如何实现不同编译抽象级别之间的协作。最后,本报告还将介绍如何针对特定硬件架构生成高性能代码并完成深度学习编译阶段的最后一步。 #

赵杰 湖南大学信息科学与工程学院教授 #

赵杰毕业于清华大学计算机科学与技术系2024年湖南结构工程师报名官网,并于2023年在法国巴黎高等师范学院与INRIA联合领导的实验室获得博士学位。现任湖南大学信息科学与工程学院教授。主要研究方向包括张量编译器、基于多面体模型的代码生成与优化、基础数学函数库。他还是华为社区技术专家组成员,与华为2012实验室团队密切合作。合作开发 AKG 张量编译器。赵杰博士以第一作者在系统软件、架构、编译器领域的顶级会议和期刊发表多篇文章,包括ASE、CC、MICRO、MLSys、OSDI、PACT、PLDI、PPoPP等,2023年在MICRO-53会议上发表的论文被提名为最佳论文。 #

5、多算力下大模型并行训练框架技术与实践

#

报告简介:AIGC浪潮带来了算力需求高峰,推动了国内外多元化算力的蓬勃发展,但也给用户带来了不同算力之间的“资源墙”问题。为了应对这些挑战,与合作伙伴基于开源构建了大模型并行训练和推理框架。本报告将分享该框架在解决多种算力挑战方面的最新进展和应用实践,包括异构混合训练技术在不同芯片上的原理和性能,以及新芯片上的算法和软硬件系统如何协同工作来实现千卡千亿MoE端到端高效模型训练、多模态长序列预训练支持以及分布式系统的新挑战、多芯片适配和跨芯片算力自动调优和自动迁移技术等。

#

敖玉龙 致远研究院研究员 #

敖玉龙现任北京致远人工智能研究院AI框架研发负责人。北京大学博士后、中国科学院博士学位。长期从事高性能计算、科学计算、人工智能等分布式系统和程序优化相关研究。曾任华为总工程师、百度高级工程师,参与相关大模型开发,具有丰富的大模型分布式系统产业研发和实践经验。 2023年,共同获得美国计算机学会“戈登·贝尔”奖。曾任职于SC、IPDPS、I??CPP,在TPDS、TACO、JCST等国际顶级会议和期刊发表论文10余篇,参与IEEE 2941.1-2022国际运营商接口标准制定,并获得多项国内专利及国际专利授权。

#

6.大型模型高效、可扩展的并行策略研究 #

报告简介:大型模型的并行策略变得越来越复杂,这给系统开发人员和性能优化人员带来了沉重的负担。为了解决上述挑战,提出了一种用于深度学习的自动分布式并行框架。与现有框架相比,它可以描述更高维度的并行算法,从而拓宽并行策略空间,能够自动搜索端到端通信的最优并行策略,使大型模型能够实现更好的并行可扩展性。针对大模型流水线并行化,提出了一种融合二阶优化方法的流水线并行化方案。该方案自动填充管道气泡中的二阶计算负载,提高模型收敛速度和GPU硬件利用率,并能显着减少大型模型的端到端训练时间。 #

李世刚 北京邮电大学教授 #

李世刚,北京邮电大学计算机学院(国家示范软件学院)“拔尖人才”教授、博士生导师,CCF、ACM、IEEE高级会员,荣获CCF高绩效杰出青年计算机专业,入选国家高层次青年人才计划。深耕并行与分布式计算、异构计算、深度学习系统等领域,主持多项国家级科研项目和课题。在SC、PPoPP、ICS、TPDS、NSDI等重要会议和期刊发表论文60余篇,解决或缓解深度学习系统和大型计算机中高效并行扩展困难、通信瓶颈、计算瓶颈等关键问题。 -规模并行算法。多次获得顶级学术会议(SC、PPoPP等)最佳论文提名奖,并荣获MLSys'21杰出论文奖、SC'22最佳成果复制奖、CACM奖。 40余次担任SC、PPoPP等权威会议TPC委员、ICS'18研讨会主席、IISWC'20出版主席、PPoPP'23宣传主席、HPC China'23 TPC Track主席、编委、CCF THPC青年编委。 #

7.RISC-V+AI系统软件

#

报告简介:近年来,RISC-V开源指令集架构发展迅速,成为当前国际技术竞争的焦点。也成为通过开源、开放凝聚产业发展共识,打造全球算力产业生态的有效抓手。尽管的GPU和CUDA软件生态系统目前主导全球AI算力市场,但业界渴望建立新的软件生态系统来突破CUDA生态壁垒。逐渐形成的共识是以RISC-V AI芯片为公分母,联合相关企业和大学科研院所,以开源、开源的方式共同制定AI扩展指令集标准,合作开发基于它们的开源人工智能系统软件堆栈。本报告讨论了这一方向、其主要机遇以及应对挑战的思路。

#

谢涛 北京大学教授

#

谢涛,北京大学讲座教授、北京大学计算机学院软件科学与工程系主任、高可信软件技术教育部重点实验室副主任。曾任美国UIUC计算机科学系正教授。当选欧洲科学院外籍院士、ACM/IEEE/AAAS/CCF会士。担任中国计算机学会系统软件委员会主任、RISC-V+AI计算生态系统(RACE)委员会主席、人工智能与机器学习技术委员会(AI/ML SIG)主席RISC-V 国际基金会的成员。

#

8、八卦炉:国产智能算力核心基础软件 #

报告简介:随着大模型技术的不断发展,其对计算能力的需求不断增加。然而,中国在获取最先进的芯片方面面临着巨大的挑战。如何充分发挥国产计算硬件的性能,让国产算力好用,满足大型模型的算力需求具有重要意义。针对这一挑战,我们开展国产智能算力核心基础软件相关研究。其中,在新一代国产超级计算机上,我们从编译器、算子库、并行加速、负载均衡等方面对大型模型进行了深度优化,达到了优化后的训练性能。 #

翟继东 清华大学终身教授

#

翟继东,清华大学计算机系终身教授、博士生导师。国家杰出青年科学基金获得者、国家重点研发计划项目负责人。清华大学计算机系高性能研究所副所长。 CCF高性能计算委员会副主任、CCF特聘委员、ACM中国高性能计算专家委员会秘书长。主要研究领域包括并行计算、编程模型和编译优化。在并行计算与系统领域顶级会议和期刊上发表论文100余篇,出版专着1部。研究成果曾获得IEEE TPDS 2023最佳论文奖、IEEE 2023最佳论文奖、ACM ICS 2023最佳学生论文奖等。担任NPC 2023程序委员会主席、IEEE 2023领域主席、 IEEE等多个国际学术期刊编委。担任清华大学学生超算队教练,指导球队13次夺得世界冠军。曾获教育部科技进步一等奖、中国计算机学会自然科学奖一等奖、CCF-IEEE CS青年科学家奖。 #

9、网络驱动的大规模AI训练——阿里云预期网络HPN7.0数据中心架构

#

报告简介:AI训练场景(尤其是大型模型训练)算力扩展的核心是大规模、高性能的数据中心网络集群。近年来2024年湖南结构工程师报名官网,阿里云提出端网融合、网络可预测的理念,在智能计算领域创新设计了HPN7.0架构体系。基于超大规模、极致性能集群网络互联的构建,本次分享阿里云HPN7.0网络系统架构的设计思维和最佳实践。

#

奚永庆,阿里云高级网络架构师 #

奚永庆是阿里云高级网络架构师。拥有网络领域授权专利十余项。现任数据中心网络架构负责人,主导阿里云HPN智能计算集群网络架构的设计与实现。 #

扫描二维码立即注册并参与会议报名

#

本次会议采用线下与线上相结合的方式。报名通道已开通。欢迎您扫描二维码免费注册。由于线下席位有限,请尽早完成报名。组委会将按照报名顺序进行审核,并于会前发出审核结果通知。公开会议将对注册用户进行在线直播。 #

会议合作、咨询、赞助请联系:

#

会议官方网站 #

责编:admin 返回顶部  打印

关于我们联系我们友情链接网站声明网站地图广告服务帮助中心