AI 기술이 발달함에 따라 다양한 딥러닝 모델들이 등장하고 있다. 이를 구현하기 위한 여러 딥러닝 프레임워크가 있는데, 2023년 현재 기준으로 실질적 강자는 바로 PyTorch이다. 이 프레임워크의 기본 구조와 활용법에 대해 알고 실제 프로젝트에 뛰어들기 위해서 PyTorch에 대한 첫 책으로 골랐다.
Pytorch는 Facebook에서 지원하는 딥러닝 프레임워크인데, 경쟁 상대로 Google에서 지원하는 Tensorflow와 Keras가 있다. 그 외에는 거의 사용되지 않고 있어서 사실상 두 프레임워크가 딥러닝 진영의 pie를 나눠 먹고 있는 셈이다. 사실 이 싸움은 이전부터 판세가 Pytorch 쪽으로 기울고 있다. 예전부터 학술쪽에서는 세밀한 조절이 가능한 PyTorch을 애용해왔다. 하지만 최근 산업에 추세도 이런 경향을 따라가고 있다. Google에서는 위기의식을 느낀 것인지 Kaggle이나 Colab와 같은 서비스에서 Tensorflow을 적극적으로 밀어주고 있는데, 내 생각엔 끝이 보이는 싸움 같다. 머지 않아 Tensorflow는 구글의 실패한 기술 중 하나로 언급될지도 모르겠다.
이 책은 딥러닝이라는 구조체를 만들기 위한 Pytorch의 블록에 대해 배우는 책이다. Variable, Tensor, nn.module와 같은 PyTorch의 기본 블록을 이용하는 방법에 대해 배웠다. 그 후 CNN과 RNN, LSTM 그리고 이를 활용한 GAN 같은 생성 모델들, ResNet, 인셉션, DenseNet, 인코더-디코더와 같이 가장 최근에 사용되는 여러 아키텍처에 대해서도 알게 되었다. 놀랐던 점은 모델의 구조가 달라질 뿐 전체적인 코드를 매우 유사해서 한 모델에 사용한 코드를 다른 곳에 재활용할 수 있다는 점이었다. 뿐만 아니라 다른 모델의 코드를 읽었을 때 직관적으로 이해할 수 있다는 점도 큰 장점이었다.
PyTorch가 왜 학술과 산업 분야에서 주로 사용되는 프레임워크가 되었는지, 어떤 점에서 강점을 갖는지에 대해 잘 알게 되었다. 다만, 이 책은 전반적인 general한 내용을 담고 있기에 자세한 정보는 얻기에 부족했다. GAN이나 Speech to Text와 같은 특정 분야에 대한 자세한 내용을 알고 싶다면 관련 책이나 논문을 더 찾아보는 편이 낫다. 실제로 구현된 다양한 모델들을 구경하면서 실제로 내가 모델을 구축해보고 사용하는 것이 다음 내가 할 일일 것이다. HuggingFace나 파이토치 커뮤니티를 자주 들어가보면서 최근 아키텍처에 대해서도 관심 꾸준히 가져야지!!
제목 | 분야 | 읽은기간 | 작가 | 추천강도 | 출판사 |
---|---|---|---|---|---|
PyTorch로 시작하는 딥러닝 | 5 기술과학 | 23.07.16-23.07.25 | 비슈누 수브라마니안 | ★★★★☆ | 에이콘 |