97 年創(chuàng)始人融資數(shù)億,打造 3D 抖音式 AI 3D 新體驗(yàn)
口述丨 VAST 創(chuàng)始人宋亞宸
作者丨鉛筆道吳欣曉
當(dāng)全球都在熱議 OpenAI 的 Sora 能用文字生成 60 秒高質(zhì)量視頻時(shí),中國(guó)的 VAST 卻在默默做一件更具挑戰(zhàn)性的事。
VAST 致力于讓 AI 不只是“拍出一段視頻”,而是“重新生成三維世界”。
過去,專業(yè)人士建一個(gè) 3D 模型要花十幾個(gè)小時(shí);現(xiàn)在,在 VAST 的 AI 3D 工作臺(tái) Tripo Studio 上,只需 6 分鐘,一個(gè)皮膚紋路和衣服褶皺都清晰可見的 3D 人物就會(huì)出現(xiàn)在屏幕上。
Tripo 能讀懂文字和圖片,一鍵生成帶完整材質(zhì)的三維模型,可直接用于游戲、動(dòng)畫、虛擬空間。
這一刻,AI 仿佛成了新的“造物者”。
VAST 的創(chuàng)始人宋亞宸,1997 年出生于杭州,擁有美國(guó)約翰霍普金斯大學(xué)國(guó)際關(guān)系學(xué)和經(jīng)濟(jì)學(xué)雙學(xué)士學(xué)位。
他熱愛一切與“內(nèi)容”相關(guān)的事物,讀歷史、看小說,還是《龍與地下城》的老玩家。這種跨學(xué)科背景讓他更像一個(gè)“講故事的人”。
今年 6 月,VAST 完成數(shù)千萬美元 Pre A+ 輪融資,由北京市人工智能產(chǎn)業(yè)投資基金領(lǐng)投,靖亞資本跟投。此前,VAST 已獲綠洲資本、達(dá)晨財(cái)智等多家知名機(jī)構(gòu)投資。
成立三年來,Vast 已獲三輪融資,每輪融資金額均達(dá)數(shù)億元,估值位居全球 AI 3D 大模型公司之首。
在商業(yè)化方面,VAST 也處于領(lǐng)先地位。截至 2025 年 7 月,其年度經(jīng)常性收入(ARR)達(dá)到 1200 萬美元,是該領(lǐng)域收入最高的公司之一。
VAST 的辦公室位于清華南門外的東升大廈,這里是中國(guó) AI 企業(yè)密度最高的區(qū)域之一。創(chuàng)始人宋亞宸表示,他希望有一天,每個(gè)人都能像發(fā)抖音一樣輕松用 AI 生成 3D 內(nèi)容,像《頭號(hào)玩家》里那樣,在三維世界中拓寬人類的幸福邊界。
聲明:訪談對(duì)象已確認(rèn)文章信息真實(shí)無誤,鉛筆道愿為其內(nèi)容做信任背書。以下是宋亞宸口述。

宋亞宸,VAST 創(chuàng)始人,獲評(píng) 2025 年《財(cái)富》中國(guó) 40 歲以下最具潛力商界精英
01 “3D 抖音”就此誕生
很多人好奇我的動(dòng)機(jī)。其實(shí)很簡(jiǎn)單,我是個(gè)“內(nèi)容雜食動(dòng)物”。
我閱讀范圍廣泛,從玄幻小說到《卡拉馬佐夫兄弟》;游戲也玩得多樣,從《全面戰(zhàn)爭(zhēng)》到網(wǎng)頁小游戲,還愛聽評(píng)書相聲。《龍與地下城》我玩了很多年,公司電競(jìng)房里還放著 DnD 的骰子。以前每周都跑團(tuán),一坐就是 10 個(gè)小時(shí),現(xiàn)在玩得少了,但熱愛依舊。
這種廣泛的興趣讓我看到了一個(gè)巨大的市場(chǎng)空白。文字有公眾號(hào)和微博,圖片有小紅書和 Instagram,視頻有抖音和 TikTok,它們都有繁榮的 UGC 生態(tài),但 3D 領(lǐng)域卻沒有一個(gè)能創(chuàng)作、分享 3D 內(nèi)容的平臺(tái)。
這顯然不正常。
VAST 最初的理想是做一個(gè)“3D 版 UGC 平臺(tái)”,可粗略理解為“3D 抖音”,即人人都能隨手發(fā) 3D 內(nèi)容。
但現(xiàn)實(shí)很殘酷,當(dāng)時(shí) 3D 創(chuàng)作門檻極高,要學(xué)十幾個(gè)小時(shí)的軟件,付費(fèi)幾十塊錢,再等上幾天渲染,這樣的門檻根本無法支撐一個(gè)大眾化平臺(tái)。
我意識(shí)到,AI 3D 可能是打開零門檻創(chuàng)作大門的鑰匙,于是我們果斷轉(zhuǎn)向,全力投入 AI 3D 大模型。
那段時(shí)間見了一兩百個(gè)投資人,真正能聽懂我們?cè)谧鍪裁吹目赡苤挥幸粌蓚€(gè)。我常常得從“《王者榮耀》其實(shí)就是一個(gè) 3D 世界”開始講起。但越是沒人懂,我越篤定,因?yàn)檫@事兒夠“硬”,也夠“COOL”。
找團(tuán)隊(duì)時(shí),我盡可能真誠(chéng)。和候選人聊天時(shí),我會(huì)打開給投資人看的商業(yè)計(jì)劃書,一頁一頁地告訴他們我們要干什么、路徑是什么、難點(diǎn)在哪里。
很幸運(yùn),我吸引來了一群比我厲害得多的人,像我們的 CTO 梁鼎、首席科學(xué)家曹炎培等,他們?cè)趯W(xué)術(shù)算法工程領(lǐng)域非常專業(yè)。
我常說,創(chuàng)業(yè)就像“填坑”。只有真心想填一個(gè)足夠大的隕石坑時(shí),才會(huì)吸引來那些擅長(zhǎng)“填大坑”的人。
02 AI 3D 臨界點(diǎn)時(shí)刻
最近忙得不可開交,核心就兩件事:把產(chǎn)品做深,讓市場(chǎng)看懂。
過去,AI 3D 更像一個(gè)用于頭腦風(fēng)暴的“玩具”,在項(xiàng)目里的價(jià)值可能只占 10%。
但從今年 9 月起,它迎來了真正的臨界點(diǎn)。我們發(fā)布了 Tripo 3.0 模型,參數(shù)直接拉升到兩百億參數(shù)級(jí)別。
我們把那個(gè)版本稱為“節(jié)點(diǎn)”,從那一刻起,AI 3D 開始進(jìn)入深層工作流。它能幫助游戲團(tuán)隊(duì)、工業(yè)設(shè)計(jì)師,直接生成可用于最終產(chǎn)品的模型,帶貼圖、有材質(zhì),甚至能自動(dòng)綁定骨骼,而不只是一個(gè)粗糙的幾何體。
它的價(jià)值占比從 10% 躍升到 50%,甚至更高。
為此,我們幾乎把全部精力都投入到打造完整工作流上,目標(biāo)是讓創(chuàng)作流程閉環(huán),讓想法更快變成成品?,F(xiàn)在說“完全閉環(huán)”可能還早,但在可見的未來,比如明年,我們有很大概率能實(shí)現(xiàn)。
另一件事是讓更多人理解 AI 3D 到底是什么。很多人不知道,AI 3D 是人類歷史上近兩三年才出現(xiàn)的“發(fā)明”,我們第一次能用一句話或一張圖,就“言出法隨”地生成一個(gè)三維物件。
我們沒有龐大的銷售團(tuán)隊(duì),早期的市場(chǎng)教育靠的是和創(chuàng)作者“玩在一起”。我們辦了創(chuàng)作者比賽,發(fā)獎(jiǎng)品,和大家一起折騰。
最早那批創(chuàng)作者非常了不起。在我們剛發(fā)布第一代 Tripo 大模型時(shí),產(chǎn)品還遠(yuǎn)不成熟,功能很有限。但他們用不完美的工具,一點(diǎn)點(diǎn)試出了各種驚艷的作品,還自發(fā)在社交媒體上分享、傳播。
這種“自來水”是我們最寶貴的資產(chǎn)。
這份努力正在被市場(chǎng)看見。到目前為止,我們的工具已經(jīng)服務(wù)了全球近 500 萬專業(yè)建模師和超過 4 萬家企業(yè)。今年 8 月,我們的月收入已經(jīng)在 200 萬美金左右,并且保持著增長(zhǎng)。融資方面,我們完成了三輪融資,每一輪的規(guī)模都在“數(shù)億人民幣”級(jí)別。這讓我對(duì)中國(guó)愿意支持長(zhǎng)期主義、硬科技的資本市場(chǎng)充滿信心。

Tripo 3.0 白模與貼圖渲染效果對(duì)比
03 一種新的生產(chǎn)力范式誕生
我一直堅(jiān)信,AI 3D 不是一個(gè)“降本增效”的工具,而是一場(chǎng)能力平權(quán)的革命。
它正在把 3D 創(chuàng)作從一項(xiàng)只有少數(shù)人掌握的精英技能,變成像打字、拍照一樣的大眾能力。
過去,一個(gè) 3D 模型需要設(shè)計(jì)師花幾周時(shí)間、耗資數(shù)萬去完成;現(xiàn)在,用我們的技術(shù),幾十秒、幾乎零成本,一個(gè)普通人打幾個(gè)字就能生成。
這就像當(dāng)年手機(jī)攝像頭普及時(shí),人類第一次意識(shí)到“人人都能創(chuàng)作”。當(dāng)創(chuàng)作門檻被打破,所有行業(yè)都會(huì)被重新排列。
這不是“替代”,而是交叉打法,新的玩法、新的產(chǎn)業(yè),都會(huì)從能力的擴(kuò)張中生長(zhǎng)出來。
1. “3D 菜單”——從照片到空間
我常拿菜單舉例。從手寫到打印,再到手機(jī)上的高清照片,每一次變化都在降低信息不對(duì)稱。但我一直有個(gè)疑問:為什么菜單不是一張 3D 的桌子?
想想我們點(diǎn)菜時(shí)的困惑,照片“看起來很誘人”,卻沒人知道這道菜有多大。如果菜單能讓顧客把菜的 3D 模型拖到虛擬桌面上,直觀看出體積與擺盤,那才是真正的體驗(yàn)升級(jí)。
2. 個(gè)性化定制——設(shè)計(jì)的邊際成本歸零
我喜歡一個(gè)有點(diǎn)“反骨”的例子。假設(shè)我想做一個(gè)“老板張大嘴巴的杯子”,每天倒水的時(shí)候,都像在老板嘴里倒開水。以前,這種定制靠自己幾乎不可能實(shí)現(xiàn),因?yàn)槌杀臼菬o限的,沒人會(huì)為此去學(xué)一年 CAD。而現(xiàn)在,用 AI 3D,只需要一張照片、一串文字,成本就變成了零。
當(dāng)“設(shè)計(jì)”變得和打字一樣簡(jiǎn)單,柔性化生產(chǎn)鏈終于能滿足海量“非標(biāo)”需求,那才是真正的大眾制造時(shí)代。
3. B2B 的柔性生產(chǎn)——制造業(yè)的去風(fēng)險(xiǎn)革命
再看一個(gè)更宏觀的例子,比如義烏或外貿(mào)行業(yè)。過去的流程是:設(shè)計(jì)、雕刻樣品、寄 100 個(gè)實(shí)物給海外買家,買家挑 5 個(gè),再“開?!保麄€(gè)過程昂貴又低效。而在 AI 3D 出現(xiàn)之后,流程變成:生成 1000 個(gè) 3D 模型,買家在數(shù)字環(huán)境里隨意挑選、修改,所有迭代都在“開模”之前完成。
這不是“更便宜的設(shè)計(jì)”,而是為制造業(yè)降低風(fēng)險(xiǎn)。“開?!痹琴Y本支出的巨大瓶頸,如今所有的試驗(yàn)、溝通、失敗,都能在虛擬世界完成。AI 3D 釋放的,不只是更高的效率,而是一種新的生產(chǎn)力范式。
04 AI 3D 的四大賺錢機(jī)會(huì)
我將 AI 3D 目前的商業(yè)化路徑清晰地分為了“四大塊”,它們構(gòu)成了我們當(dāng)前的收入來源。
第一大支柱是內(nèi)容創(chuàng)作,涵蓋游戲、動(dòng)畫、影視、CG,甚至短劇行業(yè)。AI 3D 的意義遠(yuǎn)不止“降本增效”,它壓縮了制作時(shí)間、降低了成本,也讓創(chuàng)作團(tuán)隊(duì)變得更小、更靈活。我認(rèn)同米哈游創(chuàng)始人蔡浩宇的話:“0.001% 的人會(huì)繼續(xù)把《黑神話:悟空》這樣的 3A 大作做到極致,而 99.999% 的人,會(huì)創(chuàng)造屬于自己的游戲?!盇I 3D 就是賦能那 99.999% 的人的工具,讓創(chuàng)作權(quán)從少數(shù)人手中回到大眾手中。新的 UGC 玩法正在出現(xiàn),比如《蛋仔派對(duì)》的玩家自制地圖;新的交互方式也在誕生,如《燕云十六聲》中,“言出法隨”就能改變地形。
第二大支柱是工業(yè)設(shè)計(jì)。在重工業(yè)里,比如汽車制造,AI 3D 能替代過去極其昂貴的油泥模型。在輕工業(yè)領(lǐng)域,它的應(yīng)用更廣,鞋服、家居、玩具、手辦等任何需要大量 SKU 的行業(yè),都能從中受益。我特別關(guān)注 3D 打印市場(chǎng),AI 3D 終于給了普通人,哪怕是一年級(jí)的小孩,一個(gè)擁有 3D 打印機(jī)的理由,他們可以隨心所欲地生成、打印出屬于自己的“奧特曼”。過去十年,3D 打印行業(yè)最大的問題不是硬件,而是內(nèi)容,AI 3D 正在補(bǔ)上這塊短板,讓每個(gè)人都能生產(chǎn)內(nèi)容,也讓 3D 打印真正從“工具”變成了一種創(chuàng)作方式。
第三大支柱是展示與呈現(xiàn),它幾乎和所有“面向視覺的行業(yè)”有關(guān)。在電商領(lǐng)域,AI 3D 讓商品從三張靜態(tài)照片,變成可以 360 度旋轉(zhuǎn)、可交互的模型;在教育中,孩子不再只是看二維的太陽系圖,而是能“走進(jìn)”一個(gè) 3D 的星球系統(tǒng);在廣告與數(shù)字文旅領(lǐng)域,可以重現(xiàn)一個(gè)古城。我之前提到的“3D 菜單”,就是這一類最典型的例子,它不只是在展示,更是在還原真實(shí)世界的維度。
第四大支柱是新興行業(yè),自動(dòng)駕駛仿真、機(jī)器人訓(xùn)練、數(shù)字孿生、AI 游戲、空間智能等都是未來。它們對(duì)三維世界的理解和重建能力有著天然的依賴。AI 3D 在這里的角色是“世界的生成引擎”,它讓機(jī)器不僅能在虛擬世界里學(xué)習(xí)、決策、測(cè)試,還讓我們有機(jī)會(huì)重新定義“智能”,讓人工智能真正理解空間、理解物理、理解現(xiàn)實(shí)。
我有一個(gè)可能聽上去有點(diǎn)“反常識(shí)”的觀點(diǎn):3D,才是信息的終極形態(tài)。在主流認(rèn)知里,人們普遍認(rèn)為大模型的“基底”是語言模型,而圖像、視頻、3D 只是“垂類模型”。但我恰恰認(rèn)為,事實(shí)正好相反,AI 3D 才是真正的“基座模型”。文字、圖片、視頻,只是人類在低帶寬時(shí)代,為了傳播信息而發(fā)明的“壓縮格式”,而 3D 才是世界本來的樣子,它是信息密度最高的“源文件”。未來的 AGI(通用人工智能),如果只理解文字,那將是一種“高傲”,要真正理解人類,它必須先理解物理世界,理解這個(gè)三維的現(xiàn)實(shí)。

Tripo 3.0 模型精度躍上新臺(tái)階
05 中國(guó)唯一領(lǐng)先的 AI 賽道
最后,說點(diǎn)可能聽上去有點(diǎn)“狂”,但卻是事實(shí)。在 AI 領(lǐng)域,大家常覺得中國(guó)在追隨美國(guó)。在文字、圖片、視頻大模型上,如果說“不落后”,那客觀講,也談不上“領(lǐng)先”。但在 AI 3D 這條賽道上,中國(guó)是全世界最領(lǐng)先的,沒有之一。這不是盲目的自信,而是產(chǎn)品、技術(shù)、用戶和數(shù)據(jù)共同帶來的底氣。
我們之所以有機(jī)會(huì)領(lǐng)先,是因?yàn)檫@個(gè)領(lǐng)域在早期具備四個(gè)特征:高投入、小市場(chǎng)、非共識(shí),但我們堅(jiān)信它未來會(huì)高速增長(zhǎng)。大公司不會(huì)在這樣一個(gè)“反直覺”的方向上全力投入,這恰恰給了我們創(chuàng)業(yè)公司一個(gè)難得的窗口期。
當(dāng)然,這份領(lǐng)先也讓我有些遺憾。我們?cè)谌蚍秶鷥?nèi)最早跑通了這條路,但如今 80% 到 90% 的收入來自海外,國(guó)內(nèi)很多行業(yè)和專家,還沒有真正意識(shí)到這項(xiàng)技術(shù)的價(jià)值。
我希望,未來能和國(guó)內(nèi)的產(chǎn)業(yè)伙伴一起,把這份領(lǐng)先的優(yōu)勢(shì),轉(zhuǎn)化為推動(dòng)中國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展的新動(dòng)能。
我經(jīng)常想起玩《龍與地下城》的時(shí)候。在那個(gè)想象的世界里,你可以成為任何人,做任何事。而我現(xiàn)在做 VAST,最大的夢(mèng)想,就是讓現(xiàn)實(shí)世界的每個(gè)人,也擁有一支屬于自己的“馬良神筆”。
你想創(chuàng)造一個(gè)屬于自己的世界嗎?來吧,筆就在這里。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

