Train

훈련: 다음 명령어로 Isaac-Velocity-Rough-H1-v0 태스크를 훈련.

# Train
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/train.py --task Isaac-Velocity-Rough-H1-v0 --headless

훈련 결과 파일
결과 시각화: 훈련 완료 후, 결과 시각화

# Play - Episode 0
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_0.pt

# Play - Episode 500
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_500.pt

# Play - Episode 2999
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_2999.pt

H1_Rough_Play

Inference

Warehouse에서 jit으로 내보내진 정책 기반 H1 보행 시각화

# Play in USD
./isaaclab.sh -p scripts/tutorials/03_envs/policy_inference_in_usd.py --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/exported/policy.pt

H1_Rough_Play_InUSD

학습 정책 내보내기 및 활용

정책 내보내기: 플레이 스크립트 실행 후, 정책은 실험 로그 디렉토리에 JIT 및 ONNX 파일로 내보내짐.
- 참고: 모든 학습 라이브러리가 JIT 또는 ONNX 파일 내보내기를 지원하지는 않음.
- 미지원 라이브러리: 해당 라이브러리의 play.py 스크립트를 참조하여 정책 초기화 방법 확인.

추론 실행: 내보내진 JIT 정책을 사용하여 창고 에셋을 로드하고 H1 로봇에서 추론 실행 가능.

<aside> 💡

특징	JIT (TorchScript JIT)	ONNX (Open Neural Network Exchange)
목적	PyTorch 모델의 최적화 및 PyTorch 생태계 내 배포 용이성	딥러닝 모델의 프레임워크 간 상호 운용성 및 범용 배포
프레임워크	PyTorch에 특화됨 (PyTorch 모델을 TorchScript로 변환)	프레임워크 독립적 (다양한 프레임워크에서 모델 표현)
표현 방식	PyTorch의 내부 그래프 표현 (`ScriptModule`, `ScriptFunction`)	일반적인 딥러닝 연산을 위한 표준 그래프 형식
유연성	Python의 일부 동적 기능(조건문, 루프 등)을 지원	일반적으로 정적 그래프(DAG)를 요구하며, 복잡한 제어 흐름은 제한적일 수 있음 (최근 개선 중)
최적화	PyTorch 내부 JIT 컴파일러에 의한 최적화	ONNX 런타임(ONNX Runtime) 또는 특정 하드웨어 런타임(TensorRT, OpenVINO 등)에 의한 최적화
주요 사용처	PyTorch 모델의 C++ 배포, 서비스 최적화, 모바일 배포	다양한 하드웨어(CPU, GPU, 엣지 디바이스) 및 프레임워크(TensorFlow, Keras, PyTorch 등)에 걸친 모델 배포
파일 확장자	`.pt`, `.pth`	`.onnx`
</aside>