職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
職責描述:
?設計視覺-語言-物理屬性的統(tǒng)一嵌入空間,支撐JEPA架構(gòu)中的跨模態(tài)預測(如從視覺圖像預測物理質(zhì)量、摩擦力、彈性系數(shù))
?開發(fā)基于3D Gaussian Splatting / NeRF的高效場景表征模塊,支持世界模型對三維空間的實時理解與預測
?構(gòu)建物理世界的多模態(tài)數(shù)據(jù)集(視覺 語言 物理參數(shù) 抽象概念),設計自動標注、半監(jiān)督學習與數(shù)據(jù)增強管道
?優(yōu)化視覺-語言模型(VLM)與視覺-語言-動作模型(VLA)在物理場景中的表征對齊,確保感知輸出與世界模型預測空間一致
?開發(fā)數(shù)據(jù)飛輪系統(tǒng):從仿真環(huán)境與公開數(shù)據(jù)集持續(xù)采集、清洗、標注并回流至訓練管道
?建立“感知→表征→預測”的一致性評估指標,量化多模態(tài)嵌入空間對世界模型預測精度的貢獻
任職要求:
任職要求:
?碩士及以上學位,計算機視覺、多模態(tài)學習、表征學習或認知科學方向
?精通CLIP/LLaVA/SigLIP等視覺-語言模型,熟悉多模態(tài)Transformer架構(gòu)
?熟悉3D視覺:NeRF、3D Gaussian Splatting、點云Transformer、PyTorch3D
?有大規(guī)模數(shù)據(jù)集構(gòu)建經(jīng)驗,熟悉數(shù)據(jù)管道技術(shù)(WebDataset/Apache Beam/FiftyOne)
?理解表征學習的核心問題:解耦、組合性、因果性
?有將感知模塊與世界模型/強化學習系統(tǒng)集成的實際經(jīng)驗
優(yōu)先條件:
?有VLA模型或世界模型驅(qū)動感知項目經(jīng)驗
?熟悉多模態(tài)大模型微調(diào)與對齊技術(shù)(LoRA/QLoRA/RLHF/DPO)
?有構(gòu)建物理場景理解數(shù)據(jù)集(如CLEVR、PhyRe、IntPhys)的經(jīng)驗
工作地點
地址:成都青羊區(qū)同誠路146青羊工業(yè)總部基地T區(qū)6棟
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
神州天立教育投資有限責任公司
-
教育·培訓·科研·院校
-
1000人以上
-
公司性質(zhì)未知
-
青羊工業(yè)總部t區(qū)25棟

應屆畢業(yè)生
碩士
2026-05-28 19:44:10
22人關(guān)注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
