본문 바로가기

전체 보기739

진도 빠른 안내자 '쿠브플로 운영 가이드' 조시 패터슨, 마이클 카체넬렌보겐, 오스틴 해리스 (지은이) / 김소형 (옮긴이) / 2022-01-31 원제: Kubeflow Operations Guide https://www.hanbit.co.kr/store/books/look.php?p_code=B9309356194 AI기술팀의 일원으로서 MLOps는 지상과제입니다. MLOps를 구현하는 방법에는 정답이 없어도 정도 중 하나는 구글이 제안하는 길을 따르는 것입니다. 구글이 내놓은 Kubernetes는 리눅스재단에서 적극적으로 받아 들이는 등 컨테이너화된 워크로드와 서비스를 관리하기 위한 이식할 수 있고 확장 가능한 오픈소스 플랫폼으로는 대세가 되었습니다. 그러한 기조를 바탕으로 DevOps에서 쿠버네티스는 필수요소가 되다시피 했고, 자연스럽게 쿠.. 2022. 2. 24.
오케이캐시백이 추구하는 실리가 참으로 놀랍다 어쩌다가 오케이캐시백 웹 사이트에 접속하고 기억나지 않는 암호가 무엇일까 고민하며 로그온하려다가 깜짝 놀랐다. 로그온 화면으로 바로 이동하지 않고 화면 전체를 차지하는 광고가 떡하니 나온 것이다. 오른쪽 위의 X 버튼을 눌러야만 비로소 오케이캐시백 웹사이트 로그온 화면이 나왔다. 김혜수와 전지현을 CF 모델로 쓰던 막강한 멤버십 마케팅 서비스가 어쩌다가 이 지경이 됐을까 알다가도 모르겠다. 더불어 로그온 화면에 광고를 달아야 했던 개발자는 어떤 심경일까 궁금했다. 나이는 몇일까? 사회 초년생일까, 아니면 산전수전 겪은 소위 고인물일까? 도대체 누가 저런 쪼잔해 보이는 의사결정을 내렸을까 싶다. YouTube에는 여전히 오케이캐시백 서비스 가입을 추천하는 영상도 꽤 있는데 저런 화면이 나오니 이미 망한 서.. 2022. 2. 4.
Outlook에서 SharePoint 달력을 갱신하는 방법 회사에서 MS Teams를 도입하기 전부터 SharePoint server로 팀 일정을 공유했습니다. 꼭 웹 브라우저로 접속하지 않더라도 Outlook에서 SharePoint 달력을 쉽게 연동 가능해서 잘 써왔습니다만, MS Office 365로 옮긴 이후로 뭔가 빨리 갱신이 되지 않는다는 느낌을 받곤 했습니다. 이전에 쓰던 SharePoint server는 자체 서버로 운영해서였는지 갱신주기를 딱히 의식할 일이 없었습니다. 해결방안이 있을까 하여 아웃룩 설정을 이리 저리 살펴보니 관련한 설정항목이 있긴 했습니다. 업데이트 제한을 풀어 자주 업데이트하도록 해볼까 싶어 검색을 더 했더니, 자칫 일정항목을 중복 생성하는 오류가 발생할 수 있다는 귀찮은 일을 경고하는 문서가 나왔습니다. MS 홈페이지에는 데이.. 2022. 1. 9.
박막례 여사는 유명하다 '박막례 할머니 Korea_Grandma' 유튜브 - 실화.. 미국대사관저 들어가서 잡채 만들고 옴 박막례 여사는 2021년 12월 기준으로 134만 명이 구독하는 유튜브 채널의 주역이면서, 여러가지 상징적인 의미를 지녀 구글 CEO, LUSH Co-Founder, 주한미국대사가 보자고 청한 유명인사입니다. 해외유명세에 비해 국내에서는 기사화가 덜 된다는 지적을 소셜 미디어들을 통해 접하여 검색해 보니, 실제로도 그런 면이 보였습니다. 박막례 - Google 검색 3주 전 · 올해 75세인 박막례 할머니는 130만명 이상 구독자를 거느린 유튜버로 활약하고 있다. 이순재, 신구, 백일섭, 박근형과 같은 백발의 배우들은 '꽃보다... www.google.com 서로 베껴 써 버릇하는 신문사들이 박막례 여사 .. 2021. 12. 30.
내용이 알알이 꽉 찬 '파이토치로 배우는 자연어 처리' 델립 라오, 브라이언 맥머핸 저 / 박해선 역 / 2021-06-01 https://www.hanbit.co.kr/store/books/look.php?p_code=B1231887279 인공지능, 머신러닝 입문서 저자들은 고민할 겁니다. 인공지능의 어디에서부터 시작해야 할까는 정답이 없는 주제입니다. 텐서플로나 파이토치와 같은 프레임워크를 기준으로 한 교재는 인공지능의 여러 주제인 이미지 처리, 자연어처리, 회귀 정도를 입문 수준에서도 쉬운 정도로 다룰 수밖에 없습니다. 실제로 써먹으려면 주제 중 하나를 깊이 있게 다룰 줄 알아야 하는데, 바로 이 책이 자연어처리 주제로는 입문서 다음에 읽기 좋도록 잘 기획한 중급서입니다. 중급서라고 해도 긴장할 필요는 없습니다. 입문서 내용을 많이 까먹었더라도 Pyth.. 2021. 12. 27.
안 보이는 비용을 숨기는 배임을 야기하는 조직문화 전산실에서 일하던 시절에 고객사 연하장 이카드를 구성한 적이 있다. 그때나 지금이나 상용 서비스를 쓰면 간단하다고 판단하건만, 당시 현업은 비용절감을 위해서 전산실이 개발해야 한다고 고집을 부렸다. 별 수 있나. 카드 이미지 후보군을 추리기부터 해서 기존에 있었던 메일 발송 프로그램을 어찌어찌하여 만들고 보냈다. 이 과정에서 차마 언급하기가 구질구질한 일들이 벌어졌다. 그런 식으로 연하장을 보내고 나서 현업 담당자가 사장님에게 칭찬을 받았는지 어땠는지 잘 모르겠다. 상용 서비스 쓰는 데에 수십만 원이면 되지 않았을까 싶은데, SAP로 관리회계까지 짱짱하게 구축한 대기업에서 겨우 그 돈 아꼈다고 칭찬했다면 당시 사장님 가치판단 기준을 납득해야만 하는가 싶다. 설마 안 했겠지. 당시 나는 business i.. 2021. 12. 23.
산전수전을 모두 겪고 풀어낸 DX 경험담 디지털 트랜스포메이션, 조직의 습관을 바꾸는 일 - 황재선 지음/좋은습관연구소 디지털 트랜스포메이션(Digital Transformation, DX 혹은 DT)을 해서 이렇게 저렇게 성공했다거나, DX가 정말 어렵다는 이야기는 참 많습니다. 반면, 실제 현장에서는 무엇 무엇 무엇이 어려운데 이렇게 저렇게 풀어가면 된다는 책은 많지 않습니다. 반면 이 책은 DX 추진에 필요한 사항을 쉬운 말로 술술 풀어서 설명합니다. 더불어 특기할 만한 점은 200쪽 분량으로 상당히 얇은 두께입니다. 보통 DX 어쩌구 책이라 하면, 온갖 사례와 기술과 법제를 망라하여 300쪽을 넘기곤 합니다. 왜 200쪽일까요? 저자에게 묻지는 않았지만, 이보다 얇으면 깊이가 부족해질 수 밖에 없고 이보다 두꺼우면 이 책이 설명하는 내용.. 2021. 12. 13.
당분간 두루 잘 알아듣는 음성인식 AI는 없다 저희 팀은 콜센터에 STT(Speech-to-Text 음성인식) 엔진을 납품하면서 고객사에 범용적인 음성인식을 하지 않는다고 부연하여 설명합니다. 하지 못한다가 아니라 하지 않는다고 하는 데에는 이유가 있습니다. 음성인식 원천기술을 개발하지는 못하고, 주로 Kaldi toolkit으로 엔진을 개발합니다. 그러다 보니 이런 저런 의사결정이 명쾌해집니다. 할 수 있는 것과 없는 것이 상당히 갈립니다. 그 중 하나가 언어 모델입니다. 언어 모델은 무조건 말뭉치를 크게 만든다고 해서 인식률에 도움이 되지 않습니다. 오히려 생각 없이 키운 말뭉치는 해가 됩니다. 조직 내에 어느 이상 역량이 쌓이지 못했다면 비즈니스 도메인에 따라 적당한 크기로 말뭉치를 만드는 게 유리합니다. 그렇다면 네이버, 카카오, 구글은 범용.. 2021. 12. 12.
빅데이터 모범사례 CERN 입자가속기로 유명한 CERN은 2017년에 scale out이 곤란한 Oracle DB를 포기하고 Apache Spark로 전환한 모양입니다. https://db-blog.web.cern.ch/blog/luca-canali/2017-08-apache-spark-and-cern-open-data-example The Architecture of the Next CERN Accelerator Logging Service - The Databricks Blog As a complex chain of interconnected particle accelerators at CERN, collectively these accelerators generate massive amounts of data per day,.. 2021. 12. 11.
Loop로 더욱 강해질 MS Office 365 2023년 3월 23일, 여전히 preview 딱지를 달았지만 모든 기능을 쓰도록 개방했습니다. https://loop.microsoft.com/ 최근에 MS가 적극적으로 거의 모든 제품에 적용하는 인공지능 기술도 곳곳에 들어갔습니다. Notion이 긴장할 수밖에 없겠습니다.Microsoft가 출시를 예고한 Loop는 대충 봤을 때에 All-in-One workspace를 표방하는 Notion을 연상하게 합니다. MS Teams 채팅 등에 쓰는 Loop component(구성 요소), Loop page(페이지), Loop Workspace(작업 영역) 세 요소가 있으며 아마 Notion과 제일 비슷한 요소는 Loop Workspace가 되지 않을까 합니다.2022년 1월 기준으로 MS Teams 채팅에서.. 2021. 12. 5.
NLP 뉴비에게는 중간보스인 '구글 BERT의 정석' https://www.hanbit.co.kr/store/books/look.php?p_code=B2201215526 이 책을 3장까지 읽고 든 생각은 '아이고, 수학공식이 별로 없는 수학책이구나'였습니다. 어쩐지 BERT부터 허깅페이스에 BERT의 파생 모델, BERTSUM 등 세세한 내용을 다루다가, 막판에는 한국어 모델인 KoBERT, KoGPT2까지 한 권에 죄다 다룬다고 해서 덥석 클릭했습니다만, 이걸 장점으로만 여겨서는 안 되었습니다. 그렇다 해도 몹쓸 책은 아닙니다. 제가 속한 팀에서는 이런 저런 자연어 처리를 하는데 팀원들이 실제로 운영 서비스에 쓰는 기술들이 이 책에 많이 담겼습니다. 그래서 이 책을 고르기도 했던 것입니다. 다만 이 책을 잘 소화하려면 책만 읽어서는 힘들 거라고 봅니다. .. 2021. 11. 19.
인류의 유산, 인포메이션 인포메이션 - 제임스 글릭 지음, 박래선. 김태훈 옮김, 김상욱 감수/동아시아 주변 사람들에게 데이터로 먹고 살거나 한국인으로서 서구 문명이 몇 가지 면에서 아시아를 압도했던 배경을 궁금하다면 꼭 읽어 보라고 추천했습니다. 그냥 역사를 좋아해도 재미있을 책입니다. 책갈피 '아프리카의 말하는 북 Talking drums of Africa' 북꾼들은 신호를 보내는 것이 아니라 말을 했다. (소식, 공지, 위험 알림, 시, 농담) 북 언어는 중간부호층인 언어를 변환한 코드가 아니라 말을 바로 변형한 것이었다. (예: 숲에 있는 백인이여, 높은 곳에 있는 널집으로 오라. 여인이 얌과 함께 기다린다. 어서 오라.") H = n log s (H: 정보량, n: 메시지를 구성하는 기호의 수, s: 해당 언어가 가진 .. 2021. 11. 2.
설명은 다 하는 '제대로 배우는 수학적 최적화' 인공지능 시대라 해도 최적화는 다양한 층위의 기술을 죄다 써야 현안을 해결할 만하다고 단언하는 바이다. https://www.hanbit.co.kr/store/books/look.php?p_code=B3558796278 한빛미디어에서 출간한 책을 여러 권 읽어 오면서, 이제서야 내가 배우고 싶은 주제만 오롯이 달달달 설명한 책을 만났지만 마음이 복잡해졌다. 부끄럽게도 수학에 능숙한 편이 못 되어 제대로 배우기 힘들었기 때문이다. 이 책에 나오는 여러 개념이나 기법을 이 책을 통해 처음 접했다면 이 책을 끝까지 읽어내기도 힘들다. 고교수학에 어느 정도 자신이 있는 이는 두려움 없이 도전해도 좋겠다. 목차를 보면 전통적인 최적화 외에 머신러닝과 유관한 내용도 꽤 되었다. 알고리듬 교재 같은 면도 있다. 최적.. 2021. 10. 25.
진입장벽을 낮춘 'fastai와 파이토치가 만나 꽃피운 딥러닝' 머신러닝, 딥러닝을 수학적으로 잘 풀어준 교육, 교재는 많다. 아무래도 수학이 장벽으로 느껴지곤 하니 아예 딥러닝 관련 수학을 알려주는 교육과정과 책도 꽤 있다. 그런데 좀 색다른 책이 나왔다. 저자: 제러미 하워드, 실뱅 거거 / 번역: 박찬성, 김지은 https://www.hanbit.co.kr/store/books/look.php?p_code=B7970422863 딥러닝 교재의 기본 스타일은 Coursera의 Deep learning specialization 과정이다. 어지간한 인공지능 이론/실습 과정은 선구적인 이 교육과정의 영향을 받았다고 해도 과언이 아닐 것이다. 심층 학습 deeplearning.ai에서 제공합니다. Become a Machine Learning expert. Master .. 2021. 9. 23.
정말 입문자에게 딱 맞는 '데이터 분석가의 숫자유감' 소셜 미디어 어디쯤에서 봤는지 모르겠지만 참 쉬운 내용으로 시작하길래 충동 구매했다. 다 읽고서는 동기들에게 추천했다. 여러모로 도움이 되리라 생각했다. 내 나이대 사무직, 기술직 회사원이 이 정도도 모르면 전방위로 곤란한 존재가 된다. 데이터 분석가의 숫자유감 - 권정민 지음, 주형 만화/골든래빗(주) 이전에도 입문자 용으로 책을 골라 봤는데 그보다도 훨씬 쉽다. (2020.02.25 - [BI] - 절절함을 감춘 ) 만화 비중이 크기에 앞으로도 데이터 활용에 곤란을 겪거나 어떻게 시작할지 모르는 이에게 추천하려고 한다. 이 책은 '데이터 문해력'을 개념을 설명하는 데에 집중했으며, 데이터를 어떤 식으로 판단해야 하는가 하는 실마리를 준다. 정말 관심이 생겨 통계부터 파기 시작하면 갈 길이 멀겠지만, .. 2021. 9. 12.
SharePoint 팀 사이트 정리 회사에서 팀 협업 사이트로 쓰던 MS SharePoint Server를 정리하니 데이터를 알아서 보관하라는 공지 메일을 받았습니다. 차세대 그룹웨어를 곧 오픈하기 때문이었습니다. SharePoint designer도 쓰던 나름 파워유저였던 터라 참 잘 써왔습니다. 저희 팀 역시 회사에서 SharePoint 많이 쓰기로 둘째 가라면 서러울 정도였기에 백업해야 할 자료가 꽤 나왔습니다. SharePoint를 팀에서 먼저 써버릇한 건 저였기에 조직이 바뀔 때마다 팀 로고를 급조해서 만들곤 했습니다. 조악한 흔적을 보면서 전산실을 떠나 본사에 와서 이런 저런 부침을 겪었던 기억이 잠시 스쳐지나갔습니다. 버려둘 건 버려두면서 둘러 보자니 그땐 그랬지 싶은 기록이 많군요. 아래는 2015년 이래로 팀원들과 공유하려.. 2021. 9. 8.
조직이 공작새 같이 여력을 과시해야 할 이유 조직이 가진 여력은 죄가 아니다. 여력이라는 개념을 비효율이나 태만으로 인식하던 시절이 있었다. 심지어 배임 같이 부정적으로 보기도 했다. 낡은 개념이다. 이제는 무식하게 부지런해 봐야 망하는 길로 직행할 뿐이다. 한국이 그만큼 바뀌었기 때문이다. 이제 여력은 지속가능하다는 증거이다. 과거에는 변화하는 속도가 느려 극단적으로 효율을 추구하는 게 나을 수도 있었다. 정치 로비를 하고 독과점을 유지하면 그편이 얻는 게 많았다. 이제는 그렇지 않다. 여력이 없는 조직은 변화에 휩쓸려 죽는다. 문제는 얌전히 죽지 않고 그 조직이 속한 사회의 다른 구성원을 물귀신처럼 붙들고 같이 죽는다는 점이다.  역량이 없는 조직으로서 선도 조직을 직간접적으로 본받아 역량을 쌓으며 성공한 나라가 한국이다. 미국, 일본 등 선진.. 2021. 8. 16.
DX는 그냥 해버릇 해야 돌아가는 겁니다. 역시 삼성SDS구나 싶은 글을 보았습니다. DX는 I'm ABC를 기반으로 한다는 설명은 경영진에게 돋보이기 쉽겠다는 생각이 들었습니다. 여기 저기에서 떠드는 Digitial Transformation은 이런 것이라고 주장하고픈 바를 정말 받아들이기 쉽게 정리했습니다. 본받아야겠습니다. "I’m ABC"에서 I는 사물인터넷(IoT)을, m은 모바일(mobile)을 말한다. ABC는 각각 인공지능(artificial intelligence, AI), 빅데이터(big data), 클라우드(cloud)를 뜻한다. 기업의 디지털 전환, 가장 먼저 고려할 것은? - Byline Network 책에서 ‘디지털트랜스포메이션’이나 ‘4차산업혁명’처럼 난해하고 모호한 말을 쉽게 정의하려고 노력한 흔적이 느껴졌다. 인터뷰.. 2021. 8. 11.
반응형