葛冬冬:上海交大葛冬冬团队开发的GPU加速求解器COPT吸引全球合作 发布时间:2025-06-06

当下大热的人形机器人,常常动作僵硬、反应迟钝,肢体不协调。这与它的“大脑”,即核心算法密切相关。最近,上海交通大学葛冬冬团队与人工智能企业杉数科技在GPU加速求解器COPT的技术突破,吸引哈佛大学具身智能团队主动抛出了合作橄榄枝。目前,双方已将机器人的实时姿态控制运算的理论界从万秒压缩至百秒级别,效率提升100倍,相当于给机器人装上了“智能大脑”。

    “AI当下最大的痛点,不是技术突破,而是场景应用。”上海交大智能计算研究院院长、安泰经济与管理学院特聘教授葛冬冬接受本报记者采访时表示,全球的算力正沉迷于大模型的酷炫,却缺少落地的产业机会。在此背景下,国产GPU求解器在高精度计算领域实现对传统CPU超算的弯道超车,成为AI赋能产业的“最强大脑”。他们研发的GPU加速求解器,为智能制造、能源电力、航空航天、零售消费、港口物流等行业的超350家龙头企业提供国产工业软件服务。

不断迭代技术,算法加速弥补硬件差距

        葛冬冬团队的突破始于2023年的一次跨国合作。长久以来,CPU(中央处理器)和GPU(图形处理器)是两大运算核心,前者被称为“大脑”,几乎每台电脑、手机甚至家电都依赖它运行;而后者原本只是用于图形渲染的“副手”。但如今,GPU成为AI领域的“新宠”。因为GPU擅长并行计算和重复性任务,更符合AI技术的需求。国际学术界也早已达成共识:GPU虽擅长大规模并行计算,但在复杂矩阵运算上的“不友好”,制约了其引领高精度高性能计算领域的突破。

    2023年,葛冬冬团队与美国芝加哥大学、麻省理工学院联合开发了全球首个利用GPU加速算法的开源软件cuPDLPC,并首次实现了CPU与GPU协同优化。在GPU单卡上,上亿级变量的芯片设计线性系统优化问题求解速度提升了60倍。此成果一经发布,英伟达便迅速跟进,与团队在计算优化领域开展密切合作。

    2024年,团队在多个非线性系统上又获得了百倍提速的进展,一些重要问题的求解规模和效率甚至可以提升3万倍。

    2024年2月,杉数科技求解器发布最新版本COPT7.1,成为世界首个CPU、GPU混合兼容的求解器,实现弯道超车。去年8月,团队最新一代的非线性GPU求解器发布仅一个月,便吸引了哈佛大学、谷歌、英伟达等寻求合作。斯坦福大学官网评价COPT:“开启更大规模计算的新纪元”。上个月,团队又开发了ORLM运筹大模型,已实现从数据建模到优化求解的全流程自动化。

新型求解器,为科学智能带来巨大改变

    不同于“知识问答式”的AI大模型,上海交大智算团队选择了一条截然不同的AI落地技术路径:聚焦工业级高精度计算,让AI真正成为解决现实问题的生产力工具。“如果说大模型解决的是‘沟通’问题,我们解决的则是‘决策’问题。”葛冬冬解释。

    葛冬冬团队研发的求解器COPT目前已经服务了近万个用户。比如,在京沪高铁调度的算例上,COPT的算法将铁路排班时间从数天压缩至20分钟,准确率达100%;在多省电网的运行中,过去数千台机组的实时控制依赖国外软件,每次计算都以小时计,如今搭载国产求解器的服务器,时间减少到15分钟,同时100%国产自研代码也摆脱了数据安全隐患。

    求解器COPT也吸引了不少海外用户,全球多家电网、物流、金融机构都在使用基于该核心技术的工业软件。而团队最新研发的GPU新型求解器,也为科学智能带来了巨大改变。在近期与国际顶级量子实验室的合作中,这个新型求解器被应用于量子化学研究中,将基态能量分布下的电子轨道计算规模提升了数十倍,首次将可解决问题从小分子提高到了中分子。

    “目前,更重要的是将这些最新的复杂矩阵算子与国产GPU实现适配,帮助国产硬件实现‘以软件技术的先进性弥补硬件不足的现实’。”葛冬冬说。为了这个目标,团队已在相关领域做了大量原创开发工作,并在多个核心算子上实现了对英伟达原生算子的性能超越,并已在沐曦、海光多款国产高精度GPU芯片上进行定制适配。