『비전공자도 이해할 수 있는 챗GPT』,
『비전공자도 이해할 수 있는 AI 지식』
10만 베스트셀러를 기록한
세상에서 가장 이해하기 쉬운 챗GPT 교양서

HOME » WIKI » PyTorch Lightning

PyTorch Lightning

Lightning in 15 minutes

MNIST를 3차원 임베딩으로 나타내는 오토인코더 예제1

trainer = L.Trainer(max_steps=1000, devices=4)
  • optimizer.step(), loss.backward(), optimizer.zero_grad() calls
  • Calling of model.eval(), enabling/disabling grads during evaluation
  • Checkpoint Saving and Loading
  • Tensorboard
  • Multi-GPU support 기본은 DDP로 동작한다. 주피터에서는 되지 않고 CLI에서만 가능.

Trainer

Trainer를 실행할 때 멀티 노드인 경우 num_nodes를 기입해주면 다른 노드를 기다린다. 싱글 노드인데 2이상 기입하면 무한 대기상태에 빠지므로 유의.

trainer = pl.Trainer(gpus=1, num_nodes=2, max_epochs=5, strategy="ddp")

slurm 환경에서는 Multiprocessing is handled by SLURM. 문구가 표시된다. mpirun으로 실행은 되지만 서로 통신을 못하고 대기한다. RANK 값을 얻어올 수 없기 때문으로 보이며, lightning은 OS 환경 설정을 하지 않고(enroot가 진행) 따로 MPI 통신을 하지 않는다.

Last Modified: 2024/01/07 00:11:15
자바 알고리즘 인터뷰 파이썬 알고리즘 인터뷰

카카오 코딩 테스트 출제위원이 직접 집필한,
리트코드(LeetCode) 문제로 풀어보는,
구글, 마이크로소프트, 네이버, 카카오
코딩 테스트 완벽 가이드
『자바 알고리즘 인터뷰』,
『파이썬 알고리즘 인터뷰』

이 사이트의 운영 비용을 후원할 수 있으며, 후원자에게 혜택을 제공할 예정입니다.

© 2000 - Sang Park Except where otherwise noted, content on this site is licensed under a CC BY-NC 4.0.
This site design was brought from Distill. Logo and wiki background image was brought from Bear.