본문 바로가기

독후감55

A~Z가 다 나온 '데이터 품질의 비밀' 데이터 품질의 비밀 - 데이터 신뢰를 쌓는 데이터옵스의 핵심과 엔드 투 엔드 단계별 가이드 원제: Data Quality Fundamentals 지은이: 바 모세스, 라이어 개비쉬, 몰리 보르웨르크 / 옮긴이: 데이터야놀자 / 2023/04/10 https://www.decoding.co.kr/product/데이터-품질의-비밀/ IT 일을 하는 내내 데이터와 어울렁더울렁하며 살았기에 데이터 품질과 거버넌스라는 개념 자체에는 익숙합니다. 그럼에도 속시원하게 데이터 품질관리를 했거나 거버넌스를 실현했다고 감히 말하지 못합니다. 업무 관련 법규에 따라 강제로 DBMS 메타데이터 관리를 도입했던 조직은 필요한 데이터를 모두 DB에 넣지 못했고, 그런 관리 솔루션을 도입하지 못했던 조직은 뭐는 'T', 뭐는 '1.. 2023. 5. 23.
저자의 풍부한 경험이 느껴지는 '머신러닝 시스템 설계' 머신러닝 시스템 설계 - 프로젝트 범위 산정부터 프로덕션 배포 후 모니터링까지, MLOps 완벽 해부하기 원제: Designing Machine Learning Sytems 저자: 칩 후옌 / 번역: 김대근, 김영민 / 출간: 2023-03-14 https://www.hanbit.co.kr/store/books/look.php?p_code=B1811121220 MLOps 책은 몇 권 읽었던 터라 제목만 봤을 때에는 비슷한 내용일까 했으나, 차례를 보니 독특할 정도로 많은 주제를 다룬다는 생각이 들었습니다. 다른 책이 부족하다는 게 아니라 이 책의 다루는 주제 범위가 상당히 넓습니다. 머신러닝 개요, 머신러닝에 앞서 작업해야 하는 데이터 엔지니어링, 운영을 감안한 모델 개발의 여러 요소, 모니터링과 개선에.. 2023. 4. 24.
나를 온전히 지키도록 조언하는 '정리하는 뇌' 정리하는 뇌 - 디지털 시대, 정보와 선택 과부하로 뒤엉킨 머릿속과 일상을 정리하는 기술 대니얼 J. 레비틴 (지은이) / 김성훈 (옮긴이) / 와이즈베리 / 2015-06-22 원제 : The Organized Mind (2014년) https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=61762093 유사 이래로 인류가 접하는 데이터의 양은 계속 최대치를 경신하는 중입니다. 데이터를 정보로서 가공하고 소화하여 지식으로 발전하게 하며 나아가 지혜로서 발휘해야 하건만, 작금의 시대는 데이터가 쏟아져 나와 무엇이 유익한지조차 적시에 판별하기가 힘듭니다. 그러다 보니 접근이 쉬운 악의적인 정보에 놀아나고 마는 사람들이 정말 많습니다. 자기 시간과 돈을 들여 해로운 정보를.. 2023. 4. 18.
경쟁체계는 안일하다고 하는 <경쟁으로부터의 탈출> 품질석학, 데밍박사의 경쟁으로부터의 탈출 W. 에드워드 데밍 (지은이) / 김봉균, 박성균, 박세학, 손기호, 윤기섭, 홍성훈 (옮긴이) / 한국표준협회컨설팅(나비북스) / 2004-08-16 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=510971 1980년대 들어 일본 경제는 미국을 추월할 거라는 말이 나올 정도로 부흥했다. 625 동란과 월남전 시기에 득을 본 탓이기도 하지만, 저 유명한 맥아더 장군의 부름을 받은 이 책의 저자 에드워드 데밍 박사(https://g.co/kgs/8q6bzY)가 통계적 품질 관리(SQC, Statistical Quality Control)를 일본에 정착하게 한 덕이 크다고 한다. 일본은 데밍 박사를 부른 1950년에 바로.. 2023. 4. 14.
도전해 보자 '파이썬 기반 금융 인공지능' 파이썬 기반 금융 인공지능 - 파이썬과 케라스를 활용한 금융 시계열 데이터 기반 알고리즘 트레이딩 전략 저자: 이브 힐피시 / 번역: 김도형 / 출간: 2022-09-30 https://www.hanbit.co.kr/store/books/look.php?p_code=B2409963430 주식투자 경험과 더불어 통계학을 '좀' 알고, Python의 ScikitLearn과 Pandas 라이브러리에 익숙하면 이 책을 읽기에 충분합니다. 저는 트레이딩에 대해 잘 아는 편이 아니라 중반 이후부터는 이해하기가 쉽지 않았습니다. 손절 정도의 리스크 관리까지는 그런가보다 하겠는데 상승매수, 하락매도 같은 용어가 나오니 제대로 이해하고 있는 건지 확신하기가 힘들더군요. 인공지능에 대한 지식은 없어도 됩니다. 이 책에서 .. 2023. 3. 26.
마음이 어떻게 작용하는지 고민하게 하는 '라마찬드란 박사의 두뇌 실험실' 빌라야누르 라마찬드란, 샌드라 블레이크스리 (지은이) / 신상규 (옮긴이) / 바다출판사 / 2015-04-01 원제: Phantoms in the Brain https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=62893278 뇌가 저전력으로 여러 가지 모델을 동시에 처리한다니 정말 신기했습니다. (https://news.hada.io/topic?id=7001) 인공지능 서비스를 운영하던 경험에 비추어 보면 뇌는 정말 미스테리합니다. 단순계산 능력이야 컴퓨터가 압승하지만, 여러 가지 빛, 소리 등의 신호를 거의 동시에 처리하면서 하는 일에 비해 에너지 소비는 상당히 적습니다. 당분간은 인공지능이 쫓아가지 못할 효율입니다. 그런 생각을 하던 차에 이 책을 접했습니다... 2023. 3. 10.
데이터만 거론하지 않는 '데이터로 말한다! 퍼포먼스 마케팅' 이은영 (지은이) / 한빛미디어 / 2022-11-30 https://www.hanbit.co.kr/store/books/look.php?p_code=B8839851696 이제까지 나온 퍼포먼스 마케팅 도서는 기술 트렌드를 논한 것 외에는 페이스북, 네이버 같은 광고 서비스나 Google 애널리틱스 같은 분석도구 사용법 튜토리얼이 대부분이었습니다. 반면 이 책은 독특합니다. 어떻게 보면 저자가 자신이 겪은 처절한 경험에 근간을 둔 마케팅 철학을 내보여서 스스로를 마케팅하려는 목적도 다분하지 않을까 합니다. 책 전반에는 대한민국 디지털 마케팅 역사를 약술하고, 후반에는 페이스북, 구글 같은 매체를 활용하는 방식을 설명합니다. 정말 독특하게도 책 중반에는 이 책의 미덕이라 할 만한 제조 분야 신사업 기획을 .. 2023. 3. 1.
시작을 실천하게 하는 '디지털 비주얼 씽킹' 정진호 (지은이) / 한빛미디어 / 2022-12-19 https://www.hanbit.co.kr/store/books/look.php?p_code=B4196198855 오래 전부터 정진호 님(https://lovesera.tistory.com/)이 활동하시는 모습을 보며 전시회를 가거나 강연을 듣기도 했습니다. 이 분의 장점은 소소한 과정부터 세심하게 설명하는 데에 있습니다. 이 책 역시 독자가 시작할 수 있도록 친절하고 상세하게 설명했습니다. 책이 꽤 두꺼워 언뜻 용기를 내지 못할 수 있습니다. 펼쳐서 확인해 보시길 바랍니다. 그림이 많을 뿐이라 스트레스 받지 않고 완독할 수 있습니다. 그림으로 생각을 정리하는 기술(https://www.aladin.co.kr/shop/wproduct.aspx?It.. 2023. 2. 26.
AI 모델만이 아니라 서비스를 이야기하는 'AI & UX' 개빈 루, 로버트 슈마허 주니어 (지은이), 송유미 (옮긴이) 에이콘출판 2022-01-28 원제: AI and UX: Why Artificial Intelligence Needs User Experience https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=286793217 지인 추천으로 알게 된 책으로, '인공지능에 사용자 경험이 필요한 이유'라는 부제를 보자마자 이 책을 2016년 말, 2017년 초에 봤더라면 좋았겠다는 탄식이 나왔습니다. A백화점 AI 쇼핑 어드바이저 개발 프로젝트를 시작하던 시기로서 저는 PL로 참여했습니다. A사만이 아니라 I사 한국지사도 AI 프로젝트는 처음이라 챗봇, 상품 추천 AI 모델, 빅데이터 플랫폼 개발에 치중했습니다. 프로.. 2023. 2. 16.
데이터로 전문가처럼 말하기 후기 데이터로 전문가처럼 말하기 효율적 의사 전달을 위한 데이터 시각화와 비즈니스 스토리텔링의 기술 저자: 칼 올친 / 번역: 이한호 https://hanbit.co.kr/store/books/look.php?p_code=B5424596013 데이터를 다루는 업무를 20년 정도 하면서도 입문서를 가끔 찾아 읽습니다. 어느새 놓치고 있던 기본을 되새기는 기회가 되기 때문입니다. 그래서 골라 보았습니다만, '데이터로 전문가처럼 말하기'는 입문서라고 볼 책은 아니었고, 입문단계를 벗어난 단계에서 받아들일 게 많았습니다. PART 1 커뮤니케이션과 데이터 CHAPTER 1 이것이 커뮤니케이션이다 CHAPTER 2 이것이 데이터다 데이터 분석이나 시각화를 공부해볼까 하며 입문서로만 알고 이 책을 펴들었다가 당황하지 않.. 2022. 10. 3.
철학책인가 - 알고리즘, 인생을 계산하다 알고리즘, 인생을 계산하다 - 브라이언 크리스천 & 톰 그리피스 지음, 이한음 옮김/청림출판 어려운 기술을 다루지 않는 편이긴 해도, 소위 이과 감성 없이는 완독하기 힘들다고 본다. 그러나 기술을 징검다리로 두고 사례, 예화를 쫓아가다 보면, 흥미를 잃지 않고 삶을 살아가는 데에 유용한 힌트를 얻게 된다. 이 책에서 소재로 삼은 기술은 초기 소프트웨어공학에서 다루는 알고리듬부터 무어의 법칙 대로 컴퓨터의 연산능력이 발달하다가 인터넷을 이루고 클라우드로 발전하여 인공지능까지 이제는 세상 모르는 것이 없을 듯한 컴퓨터 세상의 기반을 이루는 요소들이다. 다시 말해, 유용함에 있어서는 증명이 되고도 남은 정수이다. 그렇다 보니 우리네 인생에서 맞닥뜨리는 각종 문제를 해결하는 단초로도 활용할 수 있다는 게 이 책.. 2022. 9. 30.
혼자 공부하는 컴퓨터 구조+운영체제 학부 때에 전공필수였던 '컴퓨터 구조'와 '운영체제' 과목은 꽤 어렵게 느껴졌습니다. 그래도 전공서적은 버리지 않았고, 아주 가끔은 회사 일로 찾아보기도 했습니다. 어느새 Java도 Spring 같은 프레임워크에서 쓰는 게 보편적이라 운영체제를 직접 상대할 일이 훨씬 줄어들었고, 퍼블릭 클라우드 기반의 MSA와 쿠버네티스가 흔해지면서 컴퓨터 구조조차 가상 위에 가상 위에 가상인 상황이며 당장은 이들 프레임워크에 능숙해지는 게 우선이 된 듯도 합니다. 그래도 이 프레임워크는 왜 이게 default일까, 왜 저런 기능은 나오지 않을까 같은 궁금증을 가지는 주니어 개발자와 엔지니어가 많을 겁니다. 그러한 니즈에 딱 맞는 책이 나왔습니다. 혼자 공부하는 컴퓨터 구조+운영체제 1:1 과외하듯 배우는 컴퓨터공학 자.. 2022. 9. 12.
엄격하게 가르치는 '파이썬을 활용한 베이지안 통계(2판)' 순전히 이름이 마음에 들어서 베이지안 통계를 좋아한다. 학교에서 제대로 배운 적은 없어서 '세상에서 가장 쉬운 베이즈통계학 입문'과 '만화로 쉽게 배우는 베이즈 통계학' 책을 읽은 정도다. 어쩌다 보니 업무에서 쓴 적도 없다. 그러나 호시탐탐 베이즈 통계학을 익히고 쓸 기회로 찾아오다가 이 책을 만났다. http://hanbit.co.kr/store/books/look.php?p_code=B7798657798 통계학을 전반적으로 다룬 책을 포함해서 베이즈 통계학을 설명한 책을 통틀어 가장 상세하게 단계적으로 풀어나갔다고 단언한다. 베이즈 통계학을 배우고 싶은 사람은 이 책만 봐도 충분하지 않을까 한다. 파이썬 수준 \ 통계학 수준 통계학 좀 안다 통계학 모른다 파이썬 좀 안다 베이즈 통계학 역량을 휘리릭.. 2022. 7. 25.
아주 친절한 선생님인 '사례 분석으로 배우는 데이터 시각화' 사례 분석으로 배우는 데이터 시각화 막대 차트부터 대시보드까지 태블로로 실습하며 배우는 인사이트 도출법 https://hanbit.co.kr/store/books/look.php?p_code=B5825921855 회사에서 중요하게 쓰는 대시보드 솔루션이 태블로라 골라 보았습니다. 다행스럽게도 단순한 태블로 사용법이 아니라 기본적인 대시보드 기능과 차트 종류 별 쓰임부터 스토리 텔링까지 다루어서 기대 이상으로 유익했습니다. 스토리 텔링은 SAP Lumira 솔루션이 강조하면서 관심을 가진 주제였는데 한국 BI 솔루션에서는 주류라 할 만한 태블로가 기능으로서 제공하니, 드디어 국내에서 스토리 텔링 사례가 많아지게 되겠지요. 그랬으면 좋겠습니다. 책 내용은 태블로를 기반으로 작성했으나, 태블로를 꽤 벤치마킹한.. 2022. 6. 27.
곱씹어볼 만한 'MLOps 도입 가이드' 저자: 데이터이쿠 / 번역: 동동구 / 2022-04-29 https://hanbit.co.kr/store/books/look.php?p_code=B1913587019 MLOps는 DevOps와 함께 개념이 회자가 되기 시작한 시기부터 꾸준하게 구현하려고 애써왔다. 어느새 몇백만 원짜리 강의가 나오기도 해서 인공지능의 시대라는 반증 중 하나인가 같은 생각을 하기도 했다. 이 책은 독특하게도 '다타이쿠(데이터이쿠가 아니었다니.)'라는 AI 플랫폼 솔루션 업체가 지었다. 그럼에도 솔루션 언급은 단 한 줄도 없다. 대단하다. 어쨌든 플랫폼을 다루는 기업이 지은 만큼 MLOps의 처음부터 끝까지 모두 꼼꼼이 언급하는 기염을 토했다. 네카라쿠배라면 모를까, 이러기가 쉽지 않다. Part 1 MLOps 개념과 필요.. 2022. 5. 30.
시맨틱 데이터 모형화를 고객도 이해하게 하려면 저자: 파노스 알렉소풀로스 / 번역: 박진수 / 2022-03-15 https://www.hanbit.co.kr/store/books/look.php?p_code=B5471282287 이 책은 "그걸 하려면 시스템을 새로 구축해야 합니다." 라는 최악의 상황을 막기 위해 현실에 최대한 가깝게 모형(model)을 설계하려는 이에게 유용합니다. 이때 모형은 각종 데이터베이스, 객체지향개발의 클래스, 통계와 머신러닝 기반 예측/최적화 모형을 말합니다. 단, 초심자는 나중에 읽는 게 좋겠습니다. 세상을 MECE(Mutually Exclusive Collectively Exhaustive, 상호배제와 전체포괄)적인 관점을 준수하여 IT로 구현하지 못한다는 깨달음을 머리가 아니라 손발과 가슴으로 절감한 후에야 이 .. 2022. 4. 24.
디지털 마케팅까지 다루는 '고객을 끌어오는 구글 애널리틱스4' 입문부터 최신 고급 기법까지 실무에 필요한 웹 로그 분석 완벽 설명&실습 가이드 한빛미디어 / 저자: 문준영 / 출간: 2022-03-10 https://www.hanbit.co.kr/store/books/look.php?p_code=B7239224234 구글 애널리틱스(GA)와 애드센스를 초창기부터 써왔는데, 어느 순간 보니 기능들이 어마어마하게 많아졌습니다. 내 블로그에 누가 들어오나 궁금해서 시작했던 구글 애널리틱스가 어느새 디지털 마케팅의 주류 솔루션으로 쓰이고 있는 게 대단하다 생각하던 차에, 이 책이 나와 얼른 보았습니다. 512쪽이나 되어 GA가 이 정도로 복잡한 도구가 되었구나 언제 다 읽나 했으나, 스크린샷이 풍부하여 잘 따라 할 수 있게 한 구성일 뿐이지 글만 빼곡하지는 않아 다행이었습.. 2022. 4. 1.
진도 빠른 안내자 '쿠브플로 운영 가이드' 조시 패터슨, 마이클 카체넬렌보겐, 오스틴 해리스 (지은이) / 김소형 (옮긴이) / 2022-01-31 원제: Kubeflow Operations Guide https://www.hanbit.co.kr/store/books/look.php?p_code=B9309356194 AI기술팀의 일원으로서 MLOps는 지상과제입니다. MLOps를 구현하는 방법에는 정답이 없어도 정도 중 하나는 구글이 제안하는 길을 따르는 것입니다. 구글이 내놓은 Kubernetes는 리눅스재단에서 적극적으로 받아 들이는 등 컨테이너화된 워크로드와 서비스를 관리하기 위한 이식할 수 있고 확장 가능한 오픈소스 플랫폼으로는 대세가 되었습니다. 그러한 기조를 바탕으로 DevOps에서 쿠버네티스는 필수요소가 되다시피 했고, 자연스럽게 쿠.. 2022. 2. 24.
반응형