Text attention = 0%: Google-robot post-training 기인. Exp15(head-only)에서 인과 확정.
Image가 핵심: feature ablation — bbox_only 67% / image_only 76% / bbox+image 77%. BBox 기여 노이즈 수준.
Closed-loop: Step 2 66.7% vs Exp11 0%. Decomposition이 end-to-end를 압도.
Best PM: Exp14 Step 2 75.9% (5 seeds 76.6±1.6%).
End-to-end baseline: Exp11 58.6% (closed-loop 0%).
Exp17: 학습 종료, best ckpt 확보, full evaluation 대기.
교수 프로토콜: Step 1 ✅ / Step 2 결과 정리 필요 / Step 3 학습 완료, 평가 대기.