Isaac-Velocity-Rough-H1-v0 태스크를 훈련.# Train
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/train.py --task Isaac-Velocity-Rough-H1-v0 --headless
# Play - Episode 0
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_0.pt
# Play - Episode 500
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_500.pt
# Play - Episode 2999
./isaaclab.sh -p scripts/reinforcement_learning/rsl_rl/play.py --task Isaac-Velocity-Rough-H1-v0 --num_envs 16 --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/model_2999.pt
H1_Rough_Play
Warehouse에서 jit으로 내보내진 정책 기반 H1 보행 시각화# Play in USD
./isaaclab.sh -p scripts/tutorials/03_envs/policy_inference_in_usd.py --checkpoint logs/rsl_rl/h1_rough/2025-07-14_16-35-56/exported/policy.pt
H1_Rough_Play_InUSD
정책 내보내기: 플레이 스크립트 실행 후, 정책은 실험 로그 디렉토리에 JIT 및 ONNX 파일로 내보내짐.
play.py 스크립트를 참조하여 정책 초기화 방법 확인.추론 실행: 내보내진 JIT 정책을 사용하여 창고 에셋을 로드하고 H1 로봇에서 추론 실행 가능.
<aside> 💡
| 특징 | JIT (TorchScript JIT) | ONNX (Open Neural Network Exchange) |
|---|---|---|
| 목적 | PyTorch 모델의 최적화 및 PyTorch 생태계 내 배포 용이성 | 딥러닝 모델의 프레임워크 간 상호 운용성 및 범용 배포 |
| 프레임워크 | PyTorch에 특화됨 (PyTorch 모델을 TorchScript로 변환) | 프레임워크 독립적 (다양한 프레임워크에서 모델 표현) |
| 표현 방식 | PyTorch의 내부 그래프 표현 (ScriptModule, ScriptFunction) |
일반적인 딥러닝 연산을 위한 표준 그래프 형식 |
| 유연성 | Python의 일부 동적 기능(조건문, 루프 등)을 지원 | 일반적으로 정적 그래프(DAG)를 요구하며, 복잡한 제어 흐름은 제한적일 수 있음 (최근 개선 중) |
| 최적화 | PyTorch 내부 JIT 컴파일러에 의한 최적화 | ONNX 런타임(ONNX Runtime) 또는 특정 하드웨어 런타임(TensorRT, OpenVINO 등)에 의한 최적화 |
| 주요 사용처 | PyTorch 모델의 C++ 배포, 서비스 최적화, 모바일 배포 | 다양한 하드웨어(CPU, GPU, 엣지 디바이스) 및 프레임워크(TensorFlow, Keras, PyTorch 등)에 걸친 모델 배포 |
| 파일 확장자 | .pt, .pth |
.onnx |
| </aside> |