他父母都是普通人。高中在縣城讀,考上東南大學數學系,後來中科院自動化所讀博,清華博士後,再進商湯,一步步走出來,沒有任何海外背景,也沒有什麼顯赫的人脈起點。
在百度實習那陣子,他和地平線的余凱有過交集。余凱後來說,學術能力可以訓練,但能把 AI 技術工程化落地的人,鳳毛麟角。閻俊傑是其中之一。

進商湯之後,他七年從實習生做到副總裁。2018 年,在人手不夠的情況下,他帶隊做出了一套「All for One」模型算法,在競標裡反超旷視和依圖,拿到行業第一。有人評價他「看論文速度奇快,不管陳詞濫調,只看精華要義」。這種效率,後來成了 MiniMax 的公司文化。
他給公司取名 MiniMax,來自博弈論裡馮·諾依曼的極小化極大算法。
他的解釋是,做決策要先防住最壞的風險,再選相對最優解。
2021 年 12 月,MiniMax 完成天使輪,3100 萬美元,投前估值 1.7 億美元。進來的有米哈遊、IDG、高瓴、雲啟。
米哈遊那筆錢有點特別。閻俊傑和米哈遊董事長劉偉私交不錯,天使輪就進來了,現在劉偉還在 MiniMax 的董事會裡掛著非執行董事。
米哈遊本身就是 MiniMax 的客戶,遊戲裡的 NPC 對話、劇情生成,都在用他們的模型。
天使輪之後,故事遭遇了一個小插曲。
2023 年 3 月,矽谷銀行宣布破產。MiniMax 當時所有資金都在那家銀行。這是創業初期最險的一次,錢沒了,融資環境還一片混亂。但他們撐過去了,兩個月後拿到 A 輪 2.57 億美元,估值 11.57 億美元。
接下來的名單越來越誇張。阿里進來了,騰訊進來了,紅杉跟了進去。到上市前,7 輪融資,累計近 15 億美元,估值 42 億美元。IPO 後阿里持股 12.52%,是最大外部股東。
閻俊傑早期融資有一個習慣:只和投資機構的最高位談。他見了紅杉的沈南鵬,見了高瓴的張磊。
但這張股東表上還有一個人值得單獨講:贠燁禕。
1994 年生,約翰·霍普金斯大學電子工程學士,輔修經濟學和數學。2017 年學士畢業就進商湯,幹的是融資與戰略投資,一年後升任 CEO 徐立的行政助理兼戰略部總監。她深度參與了商湯從早期到港股上市的整個過程。
2021 年,她和閻俊傑一起出來創業。

有投資人評價她「幹練、有氣場、執行力強,有種超出其年齡的成熟」。她和閻俊傑的分工很清晰:一個定義技術願景,一個把願景變成錢和資源。閻俊傑能鑽進技術裡,頭髮都剃光了也無所謂,但市場、資本、全球化,是贠燁禕的戰場。
上市敲鍾那天,兩個人站在同一個臺子上。贠燁禕 31 歲,身價超過 40 億港元。
MiniMax 上市時,全公司 385 人,平均年齡 29 歲。
公司從成立到 2025 年 9 月,累計花費約 5 億美元。OpenAI 同期花了 400 億到 550 億美元。
這個對比有點荒謬。用不到對手 1% 的錢,做出了全模態全球領先的公司。省錢只是結果。真正的原因是他們把 AI 用到了極致。公司 80% 的代碼由 AI 完成,內部管 AI 叫「實習生」,這些實習生權限高到可以直接訪問代碼庫、改線上環境,飛書裡和它聊幾句,review 完直接上線。
這種效率讓 MiniMax 的人均產出高到不正常。
產品層面,他們從一開始就走全模態路線:語言、視頻、語音、音樂,四個方向同時壓。別人都在學 ChatGPT 做對話,閻俊傑押的是多模態融合。他的判斷是,多模態是持續提升智能的基本前提,不做全模態,下一代模型就沒有機會。
2023 年夏天,他做了一個更激進的決定。
把 80% 的算力和研發資源,全部壓到 MoE(混合專家系統)上。
那個時候,國內主流還在迭代稠密模型,MoE 被認為是「前沿但不成熟」的技術。閻俊傑的邏輯很簡單:如果要服務千萬級、億級用戶,生成 token 的成本和延時,用稠密模型根本撐不住。不做 MoE,規模上不去,一切都是白搭。
2024 年初,MiniMax 發布了國內首個 MoE 大模型。
產品上,他們也沒有去卷國內市場。C 端做了星野和 Talkie,一個在國內,一個在海外,做 AI 陪伴;海螺 AI 做視頻生成,2024 年下半年連續半年全球視頻生成應用月活第一。
現在的數字:2.36 億用戶,覆蓋 200 個國家和地區,海外收入佔 73%。B 端 21.4 萬企業客戶和開發者,Google Vertex AI、微軟 Azure、AWS 都已經部署了 MiniMax 的模型,Notion 首個開源模型選擇,也是 MiniMax。
2 月的 ARR 突破了 1.5 億美元,M2 系列單日 Token 消耗量是去年 12 月的 6 倍,其中編程方向增長超 10 倍。
這才是市場願意給 200 倍市銷率的原因。
但有一組數字要拆開看。
年報裡,C 端毛利率 4.7%,B 端毛利率 69.4%。公司 67% 的收入來自 C 端,但 C 端幾乎不貢獻毛利。四季度粗算下來,C 端毛利率已經跌到約 2.1%。整體毛利率從 12.2% 提升到 25.4%,主要是因為 B 端收入比例在四季度快速拉升,把整體數字拖上來了。
這是一道沒解完的題。
2025 年 6 月,MiniMax 發布 M1 模型。
閻俊傑在朋友圈發了一句話:
「第一次感覺到大山不是不能翻越。」

這句話背後的現實,中美頭部模型技術能力可能只差 5%,但這 5% 讓海外公司佔據了價值高出 10 倍的場景,收取高出 10 倍的價格,最終形成近百倍的商業化差距。OpenAI 最新估值超過 7000 億美元。MiniMax 上市市值 800 億港元,不到 100 億美元。
他做過一個判斷,全球未來會有五家頂級 AGI 公司,其中至少兩家來自中國,甚至有一家能做到第一。
1 月 9 日上市之後,他緊接著在 1 月 19 日出現在總理主持的專家企業家座談會上,成為繼 DeepSeek 梁文鋒之後第二位參會的 AI 大模型創始人。
然後 3 月 2 日,首份年報出來,港股當天大漲。
財報會上,閻俊傑花了很長時間講一件事:MiniMax 要從「大模型公司」變成「AI 時代的平台型公司」。
他給平台價值下了一個公式:智能密度 × Token 吞吐。互聯網時代的平台是流量入口,AI 時代的平台是能定義智能邊界、同時在商業上吃到紅利的公司。Google 在做,OpenAI 在做,他們也要做。
他面對的對手,體量是他的幾十倍。
港股上市只是把他推到了另一個戰場。季報、分析師、市值壓力,這些東西和寫程式完全不是一回事。二級市場不相信情懷,只看數字。C 端的故事能不能轉化成毛利,B 端的增速能不能維持,M3 什麼時候出來,這些問題,接下來每個季度都要回答。
但把視角拉遠一點看,MiniMax 的故事不只是一家公司的故事。
美國這幾年在晶片上卡得越來越緊。A100 限售,H100 限售,H800 也限售。邏輯很直接:掐住算力,就掐住了 AI 的喉嚨。
中國這邊被迫走了一條完全不同的路。
DeepSeek 用 H800 跑出了接近 H100 的效果。MiniMax 用 5 億美元幹了 OpenAI 花幾百億才幹到的事。閻俊傑 2023 年賭 MoE,原因是手裡那點卡根本撐不起億級用戶的推理量。M2.5 連續工作一小時 1 美元,是 GPT-5 的二十分之一。混合注意力架構、線性注意力、CISPO 算法,創新都是被逼出來的。
晶片封鎖的本意是拉大差距,但實際效果是把中國 AI 公司逼進了一條低算力、高效率的進化路線。
錢少,卡少,人少,反而逼出了極致的工程能力和架構創新。
這跟華為做晶片的邏輯一樣,你封鎖我一項能力,我就在其他維度補回來,補的過程中,可能長出你沒有的東西。
OpenAI 現在 4000 多人,2025 年燒了 80 億美元現金,到 2030 年計劃砸 6000 億美元的算力。MiniMax 385 人,累計花了 5 億美元。
誰贏還不知道。但至少現在,賭 MiniMax 會死的人越來越少了。
2014 年那個在百度實習的河南博士生,大概不會想到,十二年後他站在的這個位置,背後連著的是一整場國運級別的技術競爭。
他選擇繼續跑下去。
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia