亚洲欧美一区二区精品久久久_在线观看欧美日韩电影_好了av在线_成人丝袜18视频在线观看_亚洲欧美日韩精品久久久_**女人18毛片一区二区_欧美一级日韩免费不卡_av免费网站观看_99久久久久国产精品_色综合天天综合网天天狠天天 _91社区在线高清_黑丝美女一区二区

主頁 > 快資訊 > 正文

Step-3:顛覆性AI模型,低成本高效能引領AI新時代

2025-08-07 10:26來源:今日頭條編輯:張易川

掃一掃

分享文章到微信

掃一掃

關注99科技網微信公眾號

  在2025年7月,StepFun公司的研究團隊發布了一項革命性的研究,題為《Step-3 is Large yet Affordable: Model-system Co-design for Cost-effective Decoding》。這項研究徹底顛覆了大型AI模型成本高昂的傳統認知,展示了一個擁有321億參數的模型,通過創新設計,其運行成本竟然比許多參數更少的模型更低。該研究的完整論文可通過arXiv:2507.19427v1訪問。

  在AI技術飛速發展的今天,大型語言模型被視為數字世界的超級大腦。然而,這些“大腦”在思考時消耗的計算資源巨大,運行成本高昂。StepFun團隊面臨的挑戰是,如何設計一個既聰明又經濟的“超級大腦”——Step-3。他們的解決方案是引入了一種全新的設計思維,即“注意力-前饋網絡分離”(AFD)和多矩陣分解注意力(MFA)。

  傳統的AI模型設計往往將注意力機制和前饋網絡層層堆疊,類似于建造大樓的“疊積木”方式。而StepFun團隊則采用了“工廠流水線”的思維,將注意力計算和前饋網絡分別放在不同的“車間”獨立運行,并通過精心設計的“傳送帶”傳遞中間結果。這種設計使得整個系統能夠像現代汽車制造廠一樣高效協調運作。

  更引人注目的是,Step-3采用了一種全新的注意力機制——多矩陣分解注意力(MFA)。傳統的注意力機制需要記住所有對話內容,而MFA則像是一個聰明的秘書,用更少的“記憶空間”處理同樣復雜的信息,同時保持極高的理解準確度。這一設計顯著減少了Step-3在處理長篇對話時的存儲空間需求,提高了計算效率。

  研究結果顯示,在相同的硬件條件下,Step-3的解碼成本比同類模型DeepSeek-V3降低了約40%,比Qwen3 MoE 235B也有顯著優勢。在H800 GPU上,Step-3的解碼吞吐量達到每秒每GPU 4039個詞匯單元,遠超DeepSeek-V3的2324個。這些發現表明,通過硬件感知的模型-系統協同設計,可以在不犧牲模型能力的前提下,大幅降低AI服務的運營成本。

  Step-3的創新不僅在于技術突破,更在于其設計理念。研究團隊發現,當前AI模型設計中存在兩個普遍誤區:一是過度追求減少“記憶負擔”而忽視“思考效率”,二是盲目追求“專家系統”的稀疏性而忽略硬件特性。Step-3通過精心平衡注意力機制的計算強度、混合專家系統的稀疏度,以及硬件適配性,找到了這些因素之間的最佳平衡點。

  Step-3的核心架構創新在于將注意力和前饋網絡完全分離,讓它們各自在最適合的硬件上運行。這種設計不僅提高了計算效率,還使得系統可以根據實際負載動態調整配置比例,實現靈活的資源分配。Step-3的多矩陣分解注意力機制通過減少緩存需求并保持適中的計算強度,在各種硬件平臺上都表現出色。

  為了充分發揮Step-3的性能,研究團隊還開發了StepMesh通信庫,這是一個高效的“神經系統”,用于協調各個部分的工作。StepMesh采用了異步處理架構、基于CPU的操作執行、預注冊張量機制等多項創新技術,實現了超低延遲的數據傳輸,確保了Step-3各個組件的高效協調運行。

  在實際測試中,Step-3展現了壓倒性的性能優勢。與DeepSeek-V3相比,Step-3在H800硬件上的處理速度提升了74%,且在不同硬件平臺上都能維持相對穩定的高性能表現。在成本效益方面,Step-3也表現出色,處理8K上下文長度的對話時,每100萬詞匯單元的成本僅為0.055美元,明顯低于競爭對手。

?????投稿郵箱:jiujiukejiwang@163.com ??詳情訪問99科技網:http://www.hacbq.cn

相關推薦
理想汽車、中國汽研、東風柳汽聯袂聲明:共塑 理想汽車、中國汽研、東風柳汽聯袂聲明:共塑

原標題:理想汽車、中國汽研、東風柳汽聯袂聲明:共塑良性競合 近日,針對

行業資訊2025-08-07

一加2025上半年手機銷量增速領跑全行業,劉寶有 一加2025上半年手機銷量增速領跑全行業,劉寶有

在近期的高通驍龍游戲技術賞活動中,一加中國區品牌總經理劉寶有披露了公司

快資訊2025-08-07

2025上半年國內手機激活量排行:華為領跑,小米 2025上半年國內手機激活量排行:華為領跑,小米

近期,中國手機市場2025年上半年(1月至6月)的激活量數據被一位知名數碼博主

快資訊2025-08-07

網絡時代守護個人數據安全:四大要點助你安心 網絡時代守護個人數據安全:四大要點助你安心

在當下的數字洪流中,個人數據安全已成為公眾不可忽視的重大議題。每一次在

快資訊2025-08-07

智慧景區:科技引領旅游業轉型升級與可持續發 智慧景區:科技引領旅游業轉型升級與可持續發

在信息技術日新月異的今天,旅游業正經歷著一場深刻的變革,智慧景區的興起

快資訊2025-08-07

新一代掃地機之王,追覓首款分區清潔掃地機上 新一代掃地機之王,追覓首款分區清潔掃地機上

今日,追覓掃地機全新力作——追覓Matrix10 Ultra自動換拖布掃地機器人正式上線

快資訊2025-08-06

“人工智能+”浪潮下,TMT板塊領跑市場漲幅榜 “人工智能+”浪潮下,TMT板塊領跑市場漲幅榜

近期,人工智能領域內的焦點無疑聚焦于即將問世的GPT-5。該公司CEO頻頻在社交

快資訊2025-08-06

五招解決游戲卡頓,助你流暢暢玩告別延遲 五招解決游戲卡頓,助你流暢暢玩告別延遲

游戲玩家常常遭遇的一大困擾便是游戲過程中的畫面卡頓,這不僅影響了操作的

快資訊2025-08-06

物聯網卡采購新選擇:專業服務商,靈活高效, 物聯網卡采購新選擇:專業服務商,靈活高效,

在物聯網卡采購領域,企業時常面臨抉擇的難題:一邊是資源豐富但服務模式僵

快資訊2025-08-06

榮耀“換機克隆”App升級:實現全品牌數據遷移 榮耀“換機克隆”App升級:實現全品牌數據遷移

榮耀近日在其應用市場中更新了“換機克隆”應用,此更新使得該應用能夠支持

快資訊2025-08-06

?