7月26日至28日,世界人工智能大會(WAIC 2025)在上海世博中心盛大舉行期間,天娛數科受邀出席7月27日下午的“語料筑基 智生時代”語料創新發展論壇。天娛數科首席數據官吳邦毅在論壇圓桌環節圍繞“什么是‘好數據’”與多位行業專家展開深度探討,并以Behavision平臺百萬級3D數據集實踐為核心,系統闡釋了物理AI時代數據的核心價值,揭秘了數據支撐智能體“理解物理世界、自主交互決策”的底層邏輯。
當人工智能從“數字世界的算法博弈”邁向“物理世界的交互實踐”,數據的價值維度正被重新書寫。吳邦毅表示,若想讓智能體真正走進物理世界,“好數據”必須同時滿足物理真實性、語義可理解性、場景泛化性三大核心標準。
吳邦毅介紹,物理世界的核心是“規則”——物體的幾何結構、材質屬性、動態交互關系,共同構成了智能體行動的“約束條件”。天娛數科通過自建3D動捕與多模態數據采集基地,整合毫米級高精度3D掃描設備、雙目視覺系統及自研算法,已在Behavision平臺積累150萬條3D數據和65萬條多模態數據,其中包括20萬條機器人任務訓練的專業數據及豐富的3D鉸接數據。
物理真實性是數據的“骨架”,語義可理解性則是賦予數據“靈魂”的關鍵。在物理世界中,智能體的決策需要“跨模態認知”,實現看見物體、理解指令、執行動作三者之間的深度關聯。
“3D鉸接數據的核心價值,在于精準刻畫物體可交互部件的結構屬性與運動規律。”吳邦毅介紹,例如門的合頁轉動軌跡、抽屜的滑動阻尼、旋鈕的旋轉角度等具有運動特征和交互屬性的部件,都能通過3D鉸接數據實現細粒度描述與標注。這種對“物理細節”的極致追求,使得數據從傳統的二維視覺表達,躍升為可計算、可推理的物理結構模型。
近日,天娛數科的3D鉸接數據因技術領先性與應用價值,成功入選《北京市行業高質量數據集典型案例》,成為行業數據采集的范本。
據介紹,行業普遍面臨的“數據孤島”難題——單一場景數據難以支撐智能體應對復雜多變的物理環境,是制約物理AI落地的關鍵瓶頸。天娛數科創新采用“少量真實+大量仿真”的高效訓練模式,依托Real2Sim2Real,讓單一場景真實數據向多場景海量仿真數據拓展。
這種“真實數據錨定+仿真數據拓展”的模式,能大幅提升模型在未知環境中的泛化能力,大幅降低單任務數據成本,為數據的規模化應用掃清障礙。
三維價值體系的落地,離不開技術平臺的支撐。
Behavision平臺通過整合百萬級3D語料庫,并結合深度視覺模組等感知設備,構建了“感知-推理-執行”的技術閉環,讓數據從“靜態資源”轉化為驅動智能體交互的“動態引擎”。
目前,Behavision平臺的“人形機器人空間6D動捕長程數據”等多個數據集已在全國多地數據交易平臺上架,推動“好數據”從“技術資源”轉化為“標準化資產”。吳邦毅表示,平臺的原子技能庫支持多類型機器人動作復用,為物理AI時代打造“機器人的安卓系統”,讓不同類型的智能體能共享數據能力,加速行業技術迭代。物理AI并非替代傳統業務,而是通過重構人機交互邏輯,推動產業從“工具輔助”升級為“智能協同”。
從家庭服務機器人精準完成“整理書桌”任務,到工業機械臂在復雜工況下實現“自適應裝配”,再到智慧物流系統中AGV小車的“動態路徑規劃”,背后都是“好數據”支撐的物理AI能力。
據介紹,此次WAIC 2025上,天娛數科的“好數據”三維價值體系,不僅為物理AI領域提供了可落地的數據標準,更預示著數據要素驅動的產業變革已進入深水區。