omniture

  • <sup id="8old7"><fieldset id="8old7"></fieldset></sup><legend id="8old7"><span id="8old7"></span></legend><tt id="8old7"></tt>
      1. <td id="8old7"></td>
          四虎在线播放亚洲成人,亚洲一本二区偷拍精品,国产一区二区一卡二卡,护士张开腿被奷日出白浆,99久久精品国产一区二区蜜芽,国产福利在线观看免费第一福利,美女禁区a级全片免费观看,最新亚洲人成网站在线影院

          110萬美元懸賞!AMD發起全球戰書:誰能打破DeepSeek與Kimi的推理速度極限?

          CSDN
          2026-03-25 22:31 1837

          面向所有熱愛硬核技術的你:這一次,用代碼說話,用性能封神。

          北京2026年3月25日 /美通社/ -- 在 DeepSeek-R1 和 Kimi K2.5 等頂級開源模型確立了萬億參數的工業基準后,真正的極限性能壓榨才剛剛開始。誰能在極高并發下打破內存墻?誰能用最優雅的代碼實現最高效的算子重構?在當下的 AI 戰場,速度即是正義,吞吐量決定生死。由 AMD 與 GPU MODE 聯合發起的極客巔峰對決,正式向全球發榜:2026 線上黑客松:AMD E2E Model Speedrun 正式吹響集結號!

          • 在這里,你將直接操控 AMD 專為大模型打造的頂配云端 GPU 陣列
          • 在這里,沒有紙上談兵的 PPT,只有硬核的絕對速度與吞吐量。
          • 在這里,你的極限優化不僅能贏取巨額美金,更將直接合入主流開源框架,定義下一代 AI 推理的工業標準!

          作為本次活動的戰略社區合作伙伴,CSDN 將全程見證這場智力與算力的巔峰對決。

          你,敢來迎戰嗎?


          立即報名:AMD x GPU MODE - E2E Model Speedrun · Luma

          百萬美金獎池,憑實力"拿錢"

          本次挑戰賽設立了高達 110 萬美元的總獎金池!只要你的技術夠硬,名與利雙豐收。

          決賽入圍獎:只要從預選賽殺出重圍,躋身 Top 10,每支隊伍保底斬獲 10,000 美金!

          • Track 1 賽道桂冠 (DeepSeek-R1-0528):$350,000 獨攬!
          • Track 2 賽道桂冠 (Kimi K2.5 1T FP4):$650,000 獨攬!

          注:兩大賽道完全獨立,有實力的團隊完全可以雙線作戰,包攬百萬美金!

          賽制硬核,分秒必爭的"大逃殺"

          比賽絕非易事,本次大賽將采用"底層算子突圍 + 端到端決賽大考"的雙階段賽制。能留到最后的,注定是地表最強的性能架構師。

          預選賽 —— 底層內核的絕對廝殺

          所有參賽者需對三大核心 GPU 算子進行極限打磨:

          1. MXFP4 MoE (最高 1500 分)
          2. MLA Decode (最高 1250 分)
          3. MXFP4 GEMM (最高 1000 分)每個內核問題的得分= 最大分值 × [1 -(排名分值/20)]。排名按順序所對應分值= 0,1,2,…18,19??偡譃槿梼群藛栴}得分之和,采用上述方法。只有排名前 20 的算子才能獲得積分,總分排名前 10 的戰隊/個人,方可拿到通往決賽的門票。

          總決賽 —— 真實世界的端到端狂飆

          Top 10 選手將獲得 AMD 提供的單節點 8 卡云端 Instinct? GPU 集群。你們需要在極致并發下,挑戰兩大明星模型:

          • 賽道 1:DeepSeek-R1-0528 FP4 + MTP
          • 賽道 1 評判標準

          在 4、32、128 三種并發度下,你不僅要保證極高的吞吐量 (Token Throughput),還要死守低延遲的交互性 (Interactivity),更要確保模型精度不能掉(本賽道要求 GSM8K ≥ 0.93)。性能門檻(三個并發級別必須同時達標):


          • 賽道 2:Kimi K2.5 1T FP4
          • 賽道 2 評判標準

          在4、32、128三種并發度下,你不僅要保證極高的吞吐量 (Token Throughput),還要死守低延遲的交互性 (Interactivity),更要確保模型精度不能掉(如 Track 1 要求 GSM8K ≥ 0.93)性能門檻(三個并發級別必須同時達標):


          評分:Token Throughput per GPU(最高 600 分)+ Interactivity(最高 400 分),三個并發級別滿分 3000 分。

          跑分不是終點

          我們尋找的不是為了跑分的"特供版代碼",而是能真正造福全人類 AI 社區的工業級優化。終極必殺規則:代碼必須可 Merge!所有具備獲獎資格的團隊,其提交的代碼必須在賽后 2-4 周內,在 AMD 工程師的指導下,成功向 AMD 官方倉庫(AMD ATOM / vLLM / SGLang)發起 Pull Request 并完成合并。讓你的名字,永遠鐫刻在推動大模型時代前行的開源主分支上!

          決戰時刻表 (北京標準時間)

          報名&預選賽截止時間:4 月 7 日 2:59 PM(TOP 10 誕生)

          決賽排位戰:4 月 8 日 0:00 AM —— 5 月 16 日 2:59 PM

          全球頒獎典禮: 5 月 19 日

          如何加入這場算力狂歡?

          無論你是 AI 底層優化老兵、CUDA/Triton 極客,還是系統架構師、開源社區貢獻者,只要你對 AI 系統性能工程充滿狂熱,這里就是你的主場!(支持個人或至多 3 人組隊參賽)

          第一步:加入 AMD AI Developer Program,獲取官方彈藥庫。

          AI 開發者計劃注冊表

          第二步:查閱預選賽參考 kernels,使用 Popcorn CLI 準備你的提交。 預選賽入口及工具庫:https://github.com/gpu-mode/reference-kernels別一個人戰斗!立刻加入 GPU MODE Discord 社區 及 微信比賽專屬群,與全球頂尖開發者同頻共振,獲取實時賽事更新與官方技術支持!

           

          消息來源:CSDN
          China-PRNewsire-300-300.png
          全球TMT
          微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
          collection