본문 바로가기
BI/인공지능

NLP 뉴비에게는 중간보스인 '구글 BERT의 정석'

by wizmusa 2021. 11. 19.

구글 BERT의 정석 - 인공지능, 자연어 처리를 위한 BERT의 모든 것

https://www.hanbit.co.kr/store/books/look.php?p_code=B2201215526 

 

이 책을 3장까지 읽고 든 생각은 '아이고, 수학공식이 별로 없는 수학책이구나'였습니다. 어쩐지 BERT부터 허깅페이스에 BERT의 파생 모델, BERTSUM 등 세세한 내용을 다루다가, 막판에는 한국어 모델인 KoBERT, KoGPT2까지 한 권에 죄다 다룬다고 해서 덥석 클릭했습니다만, 이걸 장점으로만 여겨서는 안 되었습니다.

 

그렇다 해도 몹쓸 책은 아닙니다. 제가 속한 팀에서는 이런 저런 자연어 처리를 하는데 팀원들이 실제로 운영 서비스에 쓰는 기술들이 이 책에 많이 담겼습니다. 그래서 이 책을 고르기도 했던 것입니다. 다만 이 책을 잘 소화하려면 책만 읽어서는 힘들 거라고 봅니다. 책 초반에 소개하는 아래 GitHub 프로젝트를 꼭 방문하여 코드를 열어 보길 바랍니다. 코드와 같이 읽으면 훨씬 낫습니다. 

 

GitHub - PacktPublishing/Getting-Started-with-Google-BERT: Getting Started with Google BERT, published by Packt

Getting Started with Google BERT, published by Packt - GitHub - PacktPublishing/Getting-Started-with-Google-BERT: Getting Started with Google BERT, published by Packt

github.com

코드를 잘 읽으려면 PyTorch를 먼저 알아둬야 합니다. 

https://www.hanbit.co.kr/search/search_list.html?keyword=Pytorch 이걸 알아야 실습을 해보겠지요.

 

물론 수학적사고가 체화된 독자라면 술술 읽힐 거라 봅니다. 그렇더라고요. 부럽습니다.

 

마지막으로, 본문의 연습문제 해답은 부록으로 있습니다. 참 다행입니다. 그러고 보니 학부 교재로 써도 좋을 분량이 아닐까 합니다. 자연어처리 II 정도 되는 과정에 알맞겠습니다. 다시 말해 자연어처리를 처음 공부하는 참이라면 자연어처리 입문서를 먼저 읽는 게 좋습니다. Word2Vec을 모르는 채로 이 책을 읽어서는 놓치는 부분이 많을 겁니다. 기왕이면 PyTorch를 활용하는 자연어처리 입문서가 낫겠습니다.

 

파이토치로 배우는 자연어 처리

이 책은 파이토치를 기반으로 수식은 최대한 줄이고, 실무 예제를 중심으로 자연어 처리를 학습할 수 있는 입문서이다. 각 장의 엔드 투 엔드 예제는 딥러닝과 자연어 처리를 학습하는 데 꼭 필

www.hanbit.co.kr

싫은 소리를 먼저 하기는 했지만, 인공지능 주제로는 입문서만 범람하는 와중에 아주 소중한 심화서입니다. 이런 책이 아니면 인터넷 바다를 정처 없이 헤매야 합니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형