2025-07-24发表2026-03-17更新深度学习10 分钟读完 (大约1427个字)机器人轨迹的评价指标新颖性 ThriftyDAgger: Budget-Aware Novelty and Risk Gating for Interactive Imitation Learning (CoRL 21 Oral, Berkeley) 通过对当前policy进行MC-Dropout,将当前状态作为输入,得到动作集合 计算方差 该指标反映了对于当前state ,模型预测的不确定性 阅读更多
2025-07-03发表2026-03-17更新深度学习11 分钟读完 (大约1658个字)具身智能相关的最新数据集调研精密操作 Two by Two (CVPR 25) 针对装配任务的数据集,将物体分成2个零件,提供零件在空间中的组合结构阅读更多