近日,第二十届全国高性能计算学术年会(CCF HPC China 2024)召开。中国智能计算产业联盟秘书长安静出席会议并发表主题演讲,深入探讨了超智融合发展趋势及其对计算科学和产业格局的深远影响。
她表示,随着人工智能技术的快速发展,传统高性能计算(HPC)与人工智能计算(AI)的融合已成为不可逆转的趋势。这种融合被业界称为“超智融合”,正在重塑计算科学、IT产业和人类社会发展格局。
“超智融合是计算技术演进的里程碑,标志着从通用计算主导传统科学计算,过渡到异构加速的AI计算新时代。”安静表示,“它将推动计算芯片、应用、整机、系统协同创新,加快计算技术发展。”
安静分析了推动超智融合发展的几大关键因素:首先,人工智能催生的巨大算力需求正推动超算性能向适AI化升级。目前,千亿参数人工智能大模型的训练已成为名副其实的“算力黑洞”。其次,应用侧对算力结构转型存在迫切需求,基础算力、智算算力、超算算力等应用的多元化发展催生“超智融合”。第三,单一计算架构已无法应对日益复杂的计算场景,通过"超智融合"技术将超算的强大处理能力与智算的算法优化能力融合发展已成大势所趋。
在超智融合的技术路径方面,安静提出了几个关键方向:
一是算力架构创新。她强调,融合计算架构的优化与协作是超智融合系统性能提升的关键。未来的算力架构必须在硬件层面实现CPU、GPU与NPU的深度融合,以便在多样化的计算场景中提供强大的支持。同时,存储与计算的融合架构通过数据与计算任务的紧密耦合,可显著提升系统的整体性能和资源利用率。
二是算力调度技术突破。安静指出,面向AI的作业调度系统通过动态资源分配和任务优先级管理,能够更有效地处理AI任务的复杂性和动态性,提升系统的整体性能。融合计算的调度系统需要支持多种计算单元的感知与管理、跨平台任务调度和异构资源动态调度,以应对复杂的计算环境和多样化的任务需求。
三是算力服务和运营模式创新。安静表示,应运用互联网化的理念、思维、模式、技术、平台、机制打造统一的算力服务平台,整合各类算力资源,为用户提供一站式服务,降低用户获取算力资源的成本。同时,应探索平台化的应用服务机制,构建一体化算力服务平台、应用商城、开发者社区等,促进算力、数据、算法、模型、应用融合创新。
四是加强数据安全和隐私保护。安静强调,在超智融合技术的发展过程中,确保数据安全和隐私保护至关重要。她建议采用先进的加密技术,如同态加密和多方安全计算,以及隐私计算技术如联邦学习、拆分学习等,在保护数据隐私的同时实现数据的价值挖掘。
安静还介绍了超智融合在多个行业和领域的创新应用潜力。在全球气候研究领域,超智融合通过其强大的数据处理能力和高效的问题求解策略,对复杂系统进行精准模拟,为全球气候研究提供了重要支持。在能源矿产勘探领域,超智融合显示出巨大潜力,能够处理大规模的数据集,提高资源勘探的效率和精度。在生物医药研发领域,超智融合的应用加速了科技成果转化和知识边界拓宽,有助于加快药物发现和开发过程。在金融领域,超智融合也发挥着重要作用,尤其是在处理复杂数据和优化算法方面,为金融分析和决策提供了强有力的支持。
“展望未来,超算中心将向超智融合计算中心架构演进。”安静预测,“这一演进将伴随一系列技术创新,包括全精度大算力高互连通用加速芯片、异构并行体系结构、面向传统并行计算和分布式训练的编程模型、面向HPC&AI应用的智能化资源管理与作业调度工具、超大规模集群智能运维工具(AIOps)、支持混合精度计算的先进算法等。”
随着超智融合技术的不断突破和应用深化,它将成为推动科技创新的关键力量,为各行业的转型升级和数字经济发展提供核心驱动力。安静强调道,超智融合技术的发展需要产学研用各方的共同努力。她呼吁业界加强合作,共同推动超智融合技术的研发和应用,为我国计算产业的创新发展注入新动力。(柯轩)
|