pdf文档 具身智能科技前瞻探索(第3期):多任务操作、第一人称世界模型、低光照与模糊感知 VIP文档

3.85 MB 25 页 4 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
概览
2 01 02 03 3 / 3 / CONTENTS 01 02 03 04 05 06 07 4 / 4 5 MoE-ACT 1.1   6 MoE-ACT 1.2 数据来源:《MoE-ACT: Scaling Multi-Task Bimanual Manipulation with Sparse Language-Conditioned Mixture-of-Experts Transformers》  7 / 7 8 EgoSim 2.1   9 EgoSim 2.2 数据来源:《EgoSim: Egocentric World Simulator for Embodied Interaction Generation》  10 / 10 11 E-VLA VLA 3.1   12 E-VLA VLA 3.2 数据来源:《E-VLA: Event-augmented Vision-Language-Action Model for Dark and Blurred Scenes》  13 / 13 14 CRAFT 4.1   15 CRAFT 4.2 数据来源:《CRAFT: Video Diffusion for Bimanual Robot Data Generati》  16 / 16 17 Heracles 5.1   18 Heracles 5.2 数据来源:《Heracles: Bridging Precise Tracking and Generative Synthesis for General Humanoid Control》  19 / 19 20 ThermoAct VLA 6.1   21 ThermoAct VLA 6.2 数据来源:《ThermoAct: Thermal-Aware Vision-Language-Action Models for Robotic Perception and Decision-Making》  22 / 22 23    24 THANKS FOR LISTENING
下载文档到本地,方便使用
共 25 页, 还有 5 页可预览, 继续阅读
文档评分
请文明评论,理性发言.