您好!欢迎访问科技有限公司官方网站!
专注于创新研发及个性化定制服务
全系列铝电解电容器
全球服务热线:18806647329
您当前的位置: 首页>>新闻资讯>>公司新闻

公司新闻

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

更新时间  2025-07-28 10:32:10 阅读 336

【导语】7月26日,阶跃星辰于上海正式发布新一代基础大模型Step 3,该模型将于7月31日向全球企业和开发者开源。作为阶跃星辰首个全尺寸、原(yuán)生(shēng)多(duō)模(mó)态(tài)推(tuī)理(lǐ)模(mó)型(xíng),Step 3在(zài)模(mó)型(xíng)架(jià)构(gòu)与(yǔ)算(suàn)法(fǎ)设(shè)计(jì)上(shàng)实(shí)现(xiàn)创(chuàng)新(xīn),拥(yōng)有(yǒu)321B总(zǒng)参(cān)数(shù)量(liàng),展(zhǎn)现(xiàn)出(chū)强(qiáng)大(dà)的(de)视(shì)觉(jué)感(gǎn)知(zhī)与(yǔ)复(fù)杂(zá)推(tuī)理(lǐ)能(néng)力(lì)。同(tóng)时(shí),Step 3针(zhēn)对(duì)广(guǎng)泛(fàn)硬(yìng)件(jiàn)平(píng)台(tái)进(jìn)行(xíng)优(yōu)化(huà),实现行业领先的推理解码效率,尤其在国产芯片上表现卓越。此外,阶跃星辰携手近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,推动AI与芯片技术的深度融合。

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

  7 月 26 日消息,在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。

  据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆(dǎn)尝(cháng)试(shì)与(yǔ) Scale Up。Step 3 采用(yòng) MoE 架(jià)构(gòu),总(zǒng)参(cān)数(shù)量(liàng) 321B,激(jī)活(huó)参(cān)数(shù)量(liàng) 38B

  Step 3 拥(yōng)有(yǒu)强(qiáng)大(dà)的(de)视(shì)觉(jué)感(gǎn)知(zhī)和(hé)复(fù)杂(zá)推(tuī)理(lǐ)能(néng)力(lì),可(kě)准(zhǔn)确(què)完(wán)成(chéng)跨(kuà)领(lǐng)域的(de)复(fù)杂(zá)知(zhī)识(shi)理(lǐ)解(jiě)、数(shù)学(xué)与(yǔ)视(shì)觉(jué)信(xìn)息(xi)的(de)交(jiāo)叉(chā)分析,以及日常生活中的各类视觉分析问题。

  Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

  官方称,目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3 实现了行业领先的推理解码效率。

  根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的

  阶跃星辰宣布联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。