본문 바로가기
BI/인공지능

곱씹어볼 만한 'MLOps 도입 가이드'

by wizmusa 2022. 5. 30.

MLOps 도입 가이드 - 기업에서 머신러닝 모델을 가장 효율적으로 운영하는 방법

저자: 데이터이쿠 / 번역: 동동구 / 2022-04-29
https://hanbit.co.kr/store/books/look.php?p_code=B1913587019

 

MLOps는 DevOps와 함께 개념이 회자가 되기 시작한 시기부터 꾸준하게 구현하려고 애써왔다. 어느새 몇백만 원짜리 강의가 나오기도 해서 인공지능의 시대라는 반증 중 하나인가 같은 생각을 하기도 했다. 이 책은 독특하게도 '다타이쿠(데이터이쿠가 아니었다니.)'라는 AI 플랫폼 솔루션 업체가 지었다. 그럼에도 솔루션 언급은 단 한 줄도 없다. 대단하다. 어쨌든 플랫폼을 다루는 기업이 지은 만큼 MLOps의 처음부터 끝까지 모두 꼼꼼이 언급하는 기염을 토했다. 네카라쿠배라면 모를까, 이러기가 쉽지 않다.

 

Part 1 MLOps 개념과 필요성

이 책은 '선진국'에서 만들었구나 싶었다. AI 윤리에 대해 생각한 적이 있기는 하지만, 이렇게 본격적으로 리스크 관리에 대해 고심했던 적은 없었다. 단순히 MLOps가 이런 거니 만들어 보자며 시작하는 게 아니라 AI가 이런 영향을 끼치니 리스크를 평가하고 경감하며 책임주체를 따져 보자는 이야기로 시작하는 게 신기했다. 그리고 MLOps를 둘러싼 이해관계자를 나열하고 설명한 후에나 머신러닝의 기능 요소를 언급하기 시작한다. 이 책은 데이터이쿠 사의 여러 사람이 글을 나눠 썼는데, Part 1의 3장은 이 책 전체를 요약한 듯한 내용이다. 머신러닝 입문부터 거버넌스까지 주욱 언급했다.

 

Part 2 MLOps 적용 방법

드디어 상세한 이야기가 나온다. 터미널에서 명령어 입력하는 수준의 이야기는 아니다. 그건 MLOps를 구성하는 각종 솔루션 매뉴얼에서 찾아야 할 테고, 이 책은 무슨 일을 어떻게 하기 위해 어떤 기능을 구현해야 한다는 이야기를 한다. Kubeflow나 MLflow를 언급하는 일은 없다. 물론 Dataiku도 언급하지 않는다. 그래도 MLOps 씩이나 하겠다는 엔지니어라면 각 기능을 구현하기 위해 어떤 솔루션을 도입해야 할지 어렵지 않게 유추할 수 있다. 모델 개발, 상용 서비스 배포, 모니터링과 피드백 루프에 거버넌스까지의 개념은 독학으로 파악하기가 힘드므로 이 책의 미덕은 이들 생명주기를 낱낱이 언급하는 데에 있다. 이 책의 독자는 이 책을 출발점으로 삼아 계속 정진할 수 있다. 달리 말해서는 갈 길이 멀다.

 

Part 3 MLOps 실제 사례

특정 조직만의 사례는 아니지만 여러 사례를 조합하여 여러 가지 도움말을 엮어 주었다. 금융, 유통, 제조 분야 실제 현장에서는 대략 이러한 어려움이 있을 것이고 이런 방향으로 헤쳐 나가보라는 이야기해 준다. 이렇게 간접적으로만 접해도 커뮤니케이션 관련한 수고가 많았겠구나 싶다. 그래도 헤쳐 나가는 데에 재미와 보람이 있었기를 앞으로도 있기를 바란다.

 

ML 엔지니어와 관리자에게 도움이 많이 되는 책이다. 분석가라면 입문 단계에 있는 사람에게는 저게 다 뭔가 싶은 얘기가 많을 텐데 시니어나 데이터 과학자 지망자에게는 직접 할 일은 없겠지만 이해하는 게 좋은 내용이 많다. 어디까지나 도입 가이드로서 출발할 수 있게 한다는 취지이기에 책은 얇은 편이라 두려워하지 않아도 된다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


반응형

PART 1 MLOps 개념과 필요성

 

CHAPTER 1 왜 지금이고 도전 과제는 무엇인가

1.1 MLOps와 도전 과제 정의하기

1.2 리스크를 경감하기 위한 MLOps 

1.3 확장을 위한 MLOps

1.4 마치며

 

CHAPTER 2 MLOps 이해관계자들

2.1 직무 전문가 

2.2 데이터 과학자 

2.3 데이터 엔지니어

2.4 소프트웨어 엔지니어

2.5 DevOps

2.6 모델 리스크 관리자/감리인

2.7 머신러닝 아키텍트

2.8 마치며

 

CHAPTER 3 MLOps의 핵심 기능

3.1 머신러닝 입문 

3.2 모델 개발

3.3 제품화 및 배포 

3.4 모니터링

3.5 반복 및 생애주기

3.6 거버넌스

3.7 마치며

 

 

PART 2 MLOps 적용 방법

 

CHAPTER 4 모델 개발

4.1 머신러닝 모델이란? 

4.2 데이터 탐색 

4.3 특성 엔지니어링 및 특성 선택 

4.4 실험 

4.5 모델 평가 및 비교

4.6 버전 관리 및 재현 가능성 

4.7 마치며 

 

CHAPTER 5 상용화 준비

5.1 실행 환경 

5.2 모델 리스크 평가 

5.3 머신러닝에 대한 품질 검증 

5.4 테스트에 대한 핵심 고려 사항

5.5 재현 가능성과 감사 가능성

5.6 머신러닝 보안

5.7 모델 리스크 경감

5.8 마치며

 

CHAPTER 6 상용 배포

6.1 CI/CD 파이프라인

6.2 머신러닝 아티팩트 개발

6.3 배포 전략

6.4 컨테이너화 

6.5 배포 확장

6.6 요구사항과 도전 과제

6.7 마치며 

 

CHAPTER 7 모니터링과 피드백 루프

7.1 모델을 얼마나 자주 재학습시켜야 할까?

7.2 모델 성능 저하

7.3 드리프트 감지

7.4 피드백 루프

7.5 마치며

 

CHAPTER 8 모델 거버넌스

8.1 조직에 어떤 거버넌스가 필요한지 누가 결정하는가?

8.2 리스크 수준에 거버넌스 맞추기

8.3 MLOps 거버넌스를 주도하는 현행 규정 

8.4 AI 관련 규정의 최신 동향 

8.5 책임 있는 AI의 등장 

8.6 책임 있는 AI의 핵심 요소

8.7 MLOps 거버넌스 템플릿

8.8 마치며

 

 

PART 3 MLOps 실제 사례

 

CHAPTER 9 소비자 신용 리스크 관리

9.1 배경: 비즈니스 활용 사례

9.2 모델 개발 

9.3 모델 편향성에 대한 고려 사항 

9.4 상용화 준비 

9.5 상용 배포 

9.6 마치며 

 

CHAPTER 10 마케팅 추천 엔진

10.1 추천 엔진의 반란 

10.2 데이터 준비 

10.3 실험 설계 및 관리

10.4 모델 학습 및 배포

10.5 파이프라인 구조와 배포 전략

10.6 모니터링과 피드백 

10.7 마치며

 

CHAPTER 11 소비 예측

11.1 전력 시스템 

11.2 데이터 수집

11.3 문제 정의: 머신러닝인가, 머신러닝이 아닌가?

11.4 공간 및 시간 해상도 

11.5 구현

11.6 모델링

11.7 배포

11.8 모니터링

11.9 마치며

 

찾아보기

반응형