MoNaVLA V5 Sanity Analysis

Exp11

left-family → right-family collapse

LEFT, FWD+L 모두 오른쪽 계열로 접히는 구조적 편향이 관찰됐습니다.

Exp09

right-family → FWD+R pressure

RIGHT조차 FWD+R로 눌리는 경향이 보여, 우측 전방 계열 수렴이 남아 있습니다.

Verdict

좌우 계열 분리 실패

두 실험 모두 좌우 계열을 안정적으로 분리했다고 보기 어렵습니다.

실험 조건

서버 환경은 2026-04-17 기준 CPU only였습니다. nvidia-smi 단계에서 드라이버를 못 잡았고, sanity 스크립트는 validation config 반영, 배치 추론, subset 집계를 지원하도록 확장된 상태였습니다.

Reference: check_v5_left_right_sanity.py

Exp11 Result

Subset	GT	Prediction	Heuristic
`left_left`	LEFT	RIGHT	right
`left_left`	FWD+L	RIGHT	left
`right_right`	RIGHT	RIGHT	none
`right_right`	FWD+R	RIGHT	right

Exp11의 문제는 단순 LEFT=0%가 아니라, left-side 계열을 right-side 계열로 접는 구조적 bias에 가깝습니다.

Exp09 Result

Subset	GT	Prediction	Heuristic
`right_right`	RIGHT	FWD+R	none
`right_right`	FWD+R	FWD+R	right

Exp09는 Exp11처럼 우측 모든 계열을 RIGHT로 접지는 않지만, FWD+R로 수렴하는 경향이 남아 있습니다.

한계와 다음 조치

현재 validation split 자체가 고정 benchmark가 아니라 실험마다 남는 샘플 분포가 다릅니다. heuristic basket detector도 none 비율이 높아서 판정용으로는 약합니다. 그래서 이 페이지의 sanity 결과는 발견용이고, 실제 채택 기준은 고정 benchmark split으로 넘어가야 합니다.

LR 4-way Manifest LR 4-way Split

V5 LEFT/RIGHT Sanity Analysis

실험 조건

Exp11 Result

Exp09 Result

한계와 다음 조치