500장의 영상이 일관적인 좌표계를 유지하는지 모르겠습니다. 그렇다면 그냥 영상의 Pixel 범위를 정해서 모든 영상에서 같은 Pixel을 잘라내면 될 것 같은데요.
그렇지 않다면, Layer_stacking을 이용하여 하나의 파일에 밴드들로 묶어 놓고(이 때 프로젝션이 통일 됩니다. 같은 x,y 픽셀이면 같은 위경도를 의미하는 Band들이 됩니다), ROI를 이용하여 영상 subset을 하면 되지 않을까 생각합니다.
500장의 영상들이 일관적인 포맷인지 모르겠네요.
프로그래밍으로 처리한다면 ENVI_LAYER_STACKING_DOIT 루틴입니다.