首页
游戏
应用
资讯
专题
排行榜
近日消息,摩尔线程与清华系AI系统软件企业清程极智宣布建立战略合作伙伴关系,双方携手致力于加速国产大规模GPU智能计算集群的应用落地,旨在促进AI算力生态的蓬勃成长,为大型模型应用领域注入更加强劲、灵活且高效率的基础建设支持。
摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案,双方此番合作就将聚焦于万卡级超大规模GPU智算集群的开发与优化。
清程极智是一家致力于构建高效人工智能系统软件,赋能国产算力,支撑大模型行业发展的公司,自主研发了智能编译器IntelliGen、高效并行训练系统FastMoE,能够显著加速Transformer类模型和混合专家MoE模型的处理速度,部分模型性能提升最高可达15-20倍。
目前,清程极智的核心产品已全面适配摩尔线程自研的MUSA平台。
摩尔线程还宣布,已与北京智源人工智能研究院顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。
利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。
摩尔线程研发团队经过充分调研论证,还形成了Triton编译器在MUSA架构上适配的完整方案,力求实现开发者在基于摩尔线程全功能GPU进行Triton开发算子过程中,也能获得与原来一致的体验,做到CUDA框架、MUSA框架的无缝迁移。
在摩尔线程MUSA架构上,FlagGems算子库展现出了接近手写算子的计算性能,而且性能还在持续调优,极大加速了开源大模型在摩尔线程全功能GPU上的部署速度。
智源研究院是北京市于2018年11月推动成立的新型研发机构,核心目标是聚焦AI原始创新和核心技术,推动AI理论、方法、工具、系统和应用取得变革性、颠覆性突破,支撑北京建设成为全球AI学术思想、基础理论、顶尖人才、企业创新和发展政策的源头。
智源研究院的FlagGems算子库是一个使用Triton编程语言实现的高性能通用算子库,旨在为大语言模型提供一系列可应用于PyTorch框架的算子,加速模型的推理与训练,降低新算法的开发门槛。
它以Triton编程语言的易用性和编译器的标准接口为基础,为多元芯片提供了一套易适配、高性能的算子解决方案,推动基于Triton的统一、开源的软硬件生态建设。
7月3日消息,摩尔线程科技有限公司对外宣布了一项重要的技术升级,其自主研发的AI旗舰级产品——夸娥(KUAE)智算集群解决方案,实现了从原先的千卡级别跃升至万卡级别的重大跨越。
摩尔线程夸娥万卡智算集群,以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计。
夸娥万卡智算解决方案具备以下核心特性:
万卡万 P:夸娥智算集群实现单集群规模超万卡,浮点运算能力达到 10Exa-Flops,达到 PB 级的超大显存总容量、每秒 PB 级的超高速卡间互联总带宽和每秒 PB 级超高速节点互联总带宽。
长稳训练:摩尔线程夸娥万卡集群平均无故障运行时间超过 15 天,最长可实现大模型稳定训练 30 天以上,周均训练有效率在 99% 以上,远超行业平均水平。
高 MFU:夸娥万卡集群在系统软件、框架、算法等层面一系列优化,实现大模型的高效率训练,MFU(评估大模型训练效率的通用指标)最高可达到 60%。
生态友好:可加速 LLM、MoE、多模态、Mamba 等不同架构、不同模态的大模型。基于 MUSA 编程语言、完整兼容 CUDA 能力和自动化迁移工具 Musify,加速新模型“Day0”级迁移。
摩尔线程将开展三个万卡集群项目,分别为青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目。
复制本文链接 攻略文章为稻谷资源网所有,未经允许不得转载。
亚马逊战略调整:商用安保机器人Astro生命周期短暂,不足八月即宣告停产
三星3nm工艺突破质疑:官方声明性能与产量稳步前行
相关下载
5sing音乐
牛牛超市
隆运计步
口袋王牌
京日找房
空旅
乐福天气
蜻蜓天气
次神:光之觉醒
畅享免费音乐
婴语翻译器
街猫
相关攻略
马斯克紧急干预Grok AI策略,力阻2024年选举期间虚假信息传播
一游泳馆为团购卡立下门槛:限定45岁以下、学士学位女性
亚马逊海外购正式登陆京东平台,定档2024年黑色星期五盛大开业
XPG LANCER NEON RGB DDR5内存条震撼发布,速度巅峰可达8000MT/s
古尔曼爆料:苹果正研发iPad平价妙控键盘,预期明年中旬问世
南京地铁新举措:刷脸乘车系统正式启用,智慧出行新时代
《蝙蝠侠:阿甘骑士》宣传片跳票 补充新内容!
腾讯与环球音乐母公司商谈,或将收购环球音乐10%股权
论证七十余年,黄河古贤水利枢纽工程开建
三星Galaxy S24 FE震撼登场:Exynos 2400e芯片加持,售价超4000元
三星Galaxy S24系列国行推送OneUI 6.1.1更新:新增涂鸦变美图,录音秒转笔记功能
2024-09-22
【2024-08-13】今日互联网辟谣一览,上海1号线地铁有人持刀为谣言
2024-09-25
AMD锐龙9000X3D处理器曝新动态:CES 2025年震撼发布
2024-08-26
华硕ROG Swift OLED PG27AQDP震撼登场:全球首发1440p 480Hz OLED游戏盛宴
SpaceX创举:首次发射无重力多力多滋,宇航员太空享用薯片成真
微星MAG 321CUPDF惊艳登场:全球首创新曲面双模显示技术,畅享4K 160Hz
realme真我Narzo 70 Turbo 5G震撼泄露:5000万像素主摄,最高12GB+256GB组合
降速版Exynos 2400惊喜现身:三星Galaxy S24 FE或将搭载,跑分平台初露锋芒
2024第二季度半导体巨头排行:英伟达领航业界,三星、博通紧随其后,英特尔跌至第四
技嘉首推AMD 800系巅峰之作:X870E AORUS MASTER主板震撼登陆
终端灭绝永恒
生存冒险 / 1.30GB
1970-01-01 更新
甜蜜舞蹈
音乐节奏 / 62.69MB
小小村长
模拟经营 / 8.19MB
快打江湖
指尖驾驶
神都夜行录
电,玩捕鱼2
多乐果园
红雀OL
龙武
我本沉默破馆
解压女孩
百万领主最新版
土 豆地牢
Liminality最新版
魔兽世界怀旧服
黑神话:悟空
摩尔线程万卡GPU集群实现重大突破,性能飙升可达20倍提升
近日消息,摩尔线程与清华系AI系统软件企业清程极智宣布建立战略合作伙伴关系,双方携手致力于加速国产大规模GPU智能计算集群的应用落地,旨在促进AI算力生态的蓬勃成长,为大型模型应用领域注入更加强劲、灵活且高效率的基础建设支持。
摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案,双方此番合作就将聚焦于万卡级超大规模GPU智算集群的开发与优化。
清程极智是一家致力于构建高效人工智能系统软件,赋能国产算力,支撑大模型行业发展的公司,自主研发了智能编译器IntelliGen、高效并行训练系统FastMoE,能够显著加速Transformer类模型和混合专家MoE模型的处理速度,部分模型性能提升最高可达15-20倍。
目前,清程极智的核心产品已全面适配摩尔线程自研的MUSA平台。
摩尔线程还宣布,已与北京智源人工智能研究院顺利完成基于Triton语言的高性能算子库FlagGems的适配工作。
利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。
摩尔线程研发团队经过充分调研论证,还形成了Triton编译器在MUSA架构上适配的完整方案,力求实现开发者在基于摩尔线程全功能GPU进行Triton开发算子过程中,也能获得与原来一致的体验,做到CUDA框架、MUSA框架的无缝迁移。
在摩尔线程MUSA架构上,FlagGems算子库展现出了接近手写算子的计算性能,而且性能还在持续调优,极大加速了开源大模型在摩尔线程全功能GPU上的部署速度。
智源研究院是北京市于2018年11月推动成立的新型研发机构,核心目标是聚焦AI原始创新和核心技术,推动AI理论、方法、工具、系统和应用取得变革性、颠覆性突破,支撑北京建设成为全球AI学术思想、基础理论、顶尖人才、企业创新和发展政策的源头。
智源研究院的FlagGems算子库是一个使用Triton编程语言实现的高性能通用算子库,旨在为大语言模型提供一系列可应用于PyTorch框架的算子,加速模型的推理与训练,降低新算法的开发门槛。
它以Triton编程语言的易用性和编译器的标准接口为基础,为多元芯片提供了一套易适配、高性能的算子解决方案,推动基于Triton的统一、开源的软硬件生态建设。
摩尔线程夸娥智算中心:破万卡规模,解锁万P级浮点运算新纪元
7月3日消息,摩尔线程科技有限公司对外宣布了一项重要的技术升级,其自主研发的AI旗舰级产品——夸娥(KUAE)智算集群解决方案,实现了从原先的千卡级别跃升至万卡级别的重大跨越。
摩尔线程夸娥万卡智算集群,以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计。
夸娥万卡智算解决方案具备以下核心特性:
万卡万 P:夸娥智算集群实现单集群规模超万卡,浮点运算能力达到 10Exa-Flops,达到 PB 级的超大显存总容量、每秒 PB 级的超高速卡间互联总带宽和每秒 PB 级超高速节点互联总带宽。
长稳训练:摩尔线程夸娥万卡集群平均无故障运行时间超过 15 天,最长可实现大模型稳定训练 30 天以上,周均训练有效率在 99% 以上,远超行业平均水平。
高 MFU:夸娥万卡集群在系统软件、框架、算法等层面一系列优化,实现大模型的高效率训练,MFU(评估大模型训练效率的通用指标)最高可达到 60%。
生态友好:可加速 LLM、MoE、多模态、Mamba 等不同架构、不同模态的大模型。基于 MUSA 编程语言、完整兼容 CUDA 能力和自动化迁移工具 Musify,加速新模型“Day0”级迁移。
摩尔线程将开展三个万卡集群项目,分别为青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目。
复制本文链接 攻略文章为稻谷资源网所有,未经允许不得转载。
亚马逊战略调整:商用安保机器人Astro生命周期短暂,不足八月即宣告停产
三星3nm工艺突破质疑:官方声明性能与产量稳步前行
相关下载
5sing音乐
牛牛超市
隆运计步
口袋王牌
京日找房
空旅
乐福天气
蜻蜓天气
次神:光之觉醒
畅享免费音乐
婴语翻译器
街猫
相关攻略
马斯克紧急干预Grok AI策略,力阻2024年选举期间虚假信息传播
08-29一游泳馆为团购卡立下门槛:限定45岁以下、学士学位女性
08-26亚马逊海外购正式登陆京东平台,定档2024年黑色星期五盛大开业
09-28XPG LANCER NEON RGB DDR5内存条震撼发布,速度巅峰可达8000MT/s
11-19古尔曼爆料:苹果正研发iPad平价妙控键盘,预期明年中旬问世
10-29南京地铁新举措:刷脸乘车系统正式启用,智慧出行新时代
09-28《蝙蝠侠:阿甘骑士》宣传片跳票 补充新内容!
10-29腾讯与环球音乐母公司商谈,或将收购环球音乐10%股权
09-23论证七十余年,黄河古贤水利枢纽工程开建
10-29三星Galaxy S24 FE震撼登场:Exynos 2400e芯片加持,售价超4000元
09-27三星Galaxy S24系列国行推送OneUI 6.1.1更新:新增涂鸦变美图,录音秒转笔记功能
2024-09-22
【2024-08-13】今日互联网辟谣一览,上海1号线地铁有人持刀为谣言
2024-09-25
AMD锐龙9000X3D处理器曝新动态:CES 2025年震撼发布
2024-08-26
华硕ROG Swift OLED PG27AQDP震撼登场:全球首发1440p 480Hz OLED游戏盛宴
2024-08-26
SpaceX创举:首次发射无重力多力多滋,宇航员太空享用薯片成真
2024-08-26
微星MAG 321CUPDF惊艳登场:全球首创新曲面双模显示技术,畅享4K 160Hz
2024-08-26
realme真我Narzo 70 Turbo 5G震撼泄露:5000万像素主摄,最高12GB+256GB组合
2024-08-26
降速版Exynos 2400惊喜现身:三星Galaxy S24 FE或将搭载,跑分平台初露锋芒
2024-08-26
2024第二季度半导体巨头排行:英伟达领航业界,三星、博通紧随其后,英特尔跌至第四
2024-08-26
技嘉首推AMD 800系巅峰之作:X870E AORUS MASTER主板震撼登陆
2024-08-26
终端灭绝永恒
生存冒险 / 1.30GB
1970-01-01 更新
甜蜜舞蹈
音乐节奏 / 62.69MB
1970-01-01 更新
小小村长
模拟经营 / 8.19MB
1970-01-01 更新
快打江湖
指尖驾驶
神都夜行录
电,玩捕鱼2
多乐果园
红雀OL
龙武
我本沉默破馆
解压女孩
百万领主最新版
土 豆地牢
Liminality最新版
5sing音乐
牛牛超市
魔兽世界怀旧服
黑神话:悟空