← Back to Exp14 Comparison

Exp11 vs Exp14 Step 2 on Same Split

Step 2의 held-out 9 episode split을 그대로 쓰고, Exp11이 실제로 예측 가능한 공통 valid window subset 50개에서 직접 비교했습니다.

Exp11
50.0%
25/50
Step 2
34.0%
17/50
Delta
-16.0%
Step 2 - Exp11

Per Path Type

PathExp11Step 2Delta
center_straight0/2 (0.0%)0/2 (0.0%)+0.0%
center_left0/6 (0.0%)0/6 (0.0%)+0.0%
center_right6/6 (100.0%)4/6 (66.7%)-33.3%
left_straight5/6 (83.3%)5/6 (83.3%)+0.0%
left_left2/7 (28.6%)1/7 (14.3%)-14.3%
left_right4/7 (57.1%)3/7 (42.9%)-14.3%
right_straight5/6 (83.3%)4/6 (66.7%)-16.7%
right_left1/6 (16.7%)0/6 (0.0%)-16.7%
right_right2/4 (50.0%)0/4 (0.0%)-50.0%
Notes
- Exp11은 `window_size=8`, `fwd_pred_next_n=5` 기준의 valid window에서만 예측 가능하므로 공통 subset으로 정렬했습니다.
- Step 2는 같은 train/test episode split에서 다시 학습한 뒤 같은 subset에서 평가했습니다.
- 이 페이지의 수치는 기존 Step 2 전체-frame 75.9%와 직접 같은 분모가 아닙니다.