본문 바로가기

boostcamp AI tech/boostcamp AI

Monitoring tools

728x90

1. Tensorboard

from torch.utils.tensorboard import SummaryWriter
import numpy as np

writer = SummaryWriter(logs_base_dir)

for n_iter in range(100):
    writer.add_scalar('Loss/train', np.random.random(), n_iter)
    writer.add_scalar('Loss/test', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/train', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/train', np.random.random(), n_iter)
writer.flush()

- log를 먼저 기록한다.

# at server where the ml experiment has been done
tensorboard --logdir=~/ml_project/lightning_logs --port=6008
# at your local computer
ssh -NL localhost:8898:localhost:6008 [USERID]@[IP]
%load_ext tensorboard
%tensorboard --logdir "logs"

- 만약 주피터에서 열고 싶다면 이렇게 하면 된다.

- tensorboard는 단순히 loss, acc 그래프만 그려주는 것이 아니라 image, mesh, t-sne, pca, histogram등 다양한 형태로의 분석을 도와준다.

 

2. weight and biases (wandb)

- 협업에 유리한 도구이다. tensorboard처럼 실험 결과를 추적할 수 있고 코드 쉐어도 가능하다. 프로젝트 버전관리에도 유용하다.

728x90
반응형

'boostcamp AI tech > boostcamp AI' 카테고리의 다른 글

Optimization  (2) 2023.11.21
Multi gpu training, Hyper parameter Search, etc  (0) 2023.11.16
Model save, load & Transfer Learning  (0) 2023.11.15
PyTorch Project  (0) 2023.11.13
PyTorch Basics  (0) 2023.11.13