본문 바로가기

BI/인공지능66

NVIDIA GTC 2022에서 선보인 Megatron-Turing NLG 530B 한국 시간으로 3월 21일부터 24일까지 NVIDIA GTC 2022가 열립니다. GTC 2022: #1 AI Conference Register FREE. Streamed online. March 21-24, 2022. www.nvidia.com New Silicon — NVIDIA H100: A “New Engine of the World’s AI Infrastructure” New Software — AI Has “Fundamentally Changed” Software - 60개의 SDK 업데이트 공개, NVIDIA AI platform, NVAIE 2.0 ‘The Next Evolution’: Omniverse for Virtual Worlds - 디지털 트윈 구축을 위한 NASA와 아마존 사례.. 2022. 3. 23.
공인은 감내해야 할 AI 벨기에 플랑드르 지방의회 본회의는 유튜브로 생중계를 하는데 시민단체가 보니 딴짓을 하는 의원들이 많았나 봅니다. 아래 사진처럼 유튜브 영상을 vision AI로 검출하여 전화기를 보는 식으로 딴짓을 하면 소셜 미디어에 올려 망신을 주는 프로젝트를 진행했다고 합니다. 안면인식을 사용하지만, 정치인은 공인이니까 상업적으로 쓰지 않는 한 개인정보 보호법을 준수해야 하는 제약이 없습니다. 그래도 꽤나 고생했겠다 싶습니다. 비스듬히 내려다보는 카메라 각도 이미지를 의원 별로 꽤 모아야만 하니 품이 들 수밖에 없습니다. 얼굴에 있는 눈, 코, 입 랜드마크를 잘 검출하도록 신경 써야 했을 겁니다. 가뜩이나 카메라 이미지가 비스듬한데, 그 상태에서 전화기 따위를 보느라 고개를 더 숙이는 상황을 인지해야 했겠습니다. 더.. 2022. 3. 18.
통계는 강력해 지난 20대 대선은 특이하게도 지상파 3사 (KBS, MBC, SBS)와 JTBC가 출구조사를 따로 진행했습니다. 공교롭게도 두 조사의 예측결과는 달랐고 승패가 갈리고 말았습니다. 승자인 지상파 3사 출구조사에 쓰인 예측 시스템은 KBS가 개발하여 20년이나 쓰는 중인 'Decision K'로서 최근 유행하는 인공지능 기술은 쓰지 않고 전통적인 통계학 기법만 사용했다고 합니다. 박빙 대선결과 ‘적중’한 지상파 3사 출구조사…비법은 무엇? 실제 결과와 0.1%p 차이로 적중한 예측사전투표 비중확대 반영…‘1만명 전화조사’ 보정 주효 www.hani.co.kr Vision, STT(음성인식), TA(텍스트 분석) 분야는 모두 deep learning이라는 인공지능 기술의 강력함을 근간으로 최근 들어 급속도로.. 2022. 3. 17.
진도 빠른 안내자 '쿠브플로 운영 가이드' 조시 패터슨, 마이클 카체넬렌보겐, 오스틴 해리스 (지은이) / 김소형 (옮긴이) / 2022-01-31 원제: Kubeflow Operations Guide https://www.hanbit.co.kr/store/books/look.php?p_code=B9309356194 AI기술팀의 일원으로서 MLOps는 지상과제입니다. MLOps를 구현하는 방법에는 정답이 없어도 정도 중 하나는 구글이 제안하는 길을 따르는 것입니다. 구글이 내놓은 Kubernetes는 리눅스재단에서 적극적으로 받아 들이는 등 컨테이너화된 워크로드와 서비스를 관리하기 위한 이식할 수 있고 확장 가능한 오픈소스 플랫폼으로는 대세가 되었습니다. 그러한 기조를 바탕으로 DevOps에서 쿠버네티스는 필수요소가 되다시피 했고, 자연스럽게 쿠.. 2022. 2. 24.
내용이 알알이 꽉 찬 '파이토치로 배우는 자연어 처리' 델립 라오, 브라이언 맥머핸 저 / 박해선 역 / 2021-06-01 https://www.hanbit.co.kr/store/books/look.php?p_code=B1231887279 인공지능, 머신러닝 입문서 저자들은 고민할 겁니다. 인공지능의 어디에서부터 시작해야 할까는 정답이 없는 주제입니다. 텐서플로나 파이토치와 같은 프레임워크를 기준으로 한 교재는 인공지능의 여러 주제인 이미지 처리, 자연어처리, 회귀 정도를 입문 수준에서도 쉬운 정도로 다룰 수밖에 없습니다. 실제로 써먹으려면 주제 중 하나를 깊이 있게 다룰 줄 알아야 하는데, 바로 이 책이 자연어처리 주제로는 입문서 다음에 읽기 좋도록 잘 기획한 중급서입니다. 중급서라고 해도 긴장할 필요는 없습니다. 입문서 내용을 많이 까먹었더라도 Pyth.. 2021. 12. 27.
당분간 두루 잘 알아듣는 음성인식 AI는 없다 저희 팀은 콜센터에 STT(Speech-to-Text 음성인식) 엔진을 납품하면서 고객사에 범용적인 음성인식을 하지 않는다고 부연하여 설명합니다. 하지 못한다가 아니라 하지 않는다고 하는 데에는 이유가 있습니다. 음성인식 원천기술을 개발하지는 못하고, 주로 Kaldi toolkit으로 엔진을 개발합니다. 그러다 보니 이런 저런 의사결정이 명쾌해집니다. 할 수 있는 것과 없는 것이 상당히 갈립니다. 그 중 하나가 언어 모델입니다. 언어 모델은 무조건 말뭉치를 크게 만든다고 해서 인식률에 도움이 되지 않습니다. 오히려 생각 없이 키운 말뭉치는 해가 됩니다. 조직 내에 어느 이상 역량이 쌓이지 못했다면 비즈니스 도메인에 따라 적당한 크기로 말뭉치를 만드는 게 유리합니다. 그렇다면 네이버, 카카오, 구글은 범용.. 2021. 12. 12.
NLP 뉴비에게는 중간보스인 '구글 BERT의 정석' https://www.hanbit.co.kr/store/books/look.php?p_code=B2201215526 이 책을 3장까지 읽고 든 생각은 '아이고, 수학공식이 별로 없는 수학책이구나'였습니다. 어쩐지 BERT부터 허깅페이스에 BERT의 파생 모델, BERTSUM 등 세세한 내용을 다루다가, 막판에는 한국어 모델인 KoBERT, KoGPT2까지 한 권에 죄다 다룬다고 해서 덥석 클릭했습니다만, 이걸 장점으로만 여겨서는 안 되었습니다. 그렇다 해도 몹쓸 책은 아닙니다. 제가 속한 팀에서는 이런 저런 자연어 처리를 하는데 팀원들이 실제로 운영 서비스에 쓰는 기술들이 이 책에 많이 담겼습니다. 그래서 이 책을 고르기도 했던 것입니다. 다만 이 책을 잘 소화하려면 책만 읽어서는 힘들 거라고 봅니다. .. 2021. 11. 19.
진입장벽을 낮춘 'fastai와 파이토치가 만나 꽃피운 딥러닝' 머신러닝, 딥러닝을 수학적으로 잘 풀어준 교육, 교재는 많다. 아무래도 수학이 장벽으로 느껴지곤 하니 아예 딥러닝 관련 수학을 알려주는 교육과정과 책도 꽤 있다. 그런데 좀 색다른 책이 나왔다. 저자: 제러미 하워드, 실뱅 거거 / 번역: 박찬성, 김지은 https://www.hanbit.co.kr/store/books/look.php?p_code=B7970422863 딥러닝 교재의 기본 스타일은 Coursera의 Deep learning specialization 과정이다. 어지간한 인공지능 이론/실습 과정은 선구적인 이 교육과정의 영향을 받았다고 해도 과언이 아닐 것이다. 심층 학습 deeplearning.ai에서 제공합니다. Become a Machine Learning expert. Master .. 2021. 9. 23.
하산을 빨리 시키는 듯싶은 <GAN 첫걸음> 타리크 라시드 씨가 에 이어 을 내놓았습니다. GAN 첫걸음 파이토치 신경망 입문부터 연예인 얼굴 생성까지 저자: 타리크 라시드 / 번역: 고락윤 https://www.hanbit.co.kr/store/books/look.php?p_code=B9417661237 이 제게 참 유익했기에 이번 책도 평소 관심사와 엮여서 무척 기대했습니다. 팀 업무에 쓸 머신러닝 학습 데이터가 부족해서 만들어 볼까 생각해 왔던 중이었기 때문입니다. 내용은 정말 알찹니다. 저자가 입문자인 독자를 배려하여 Google Colab을 써서 실습하도록 했기에 장소에 구애 받지 않고 공부하기에도 딱 좋습니다. 그러나 읽고 나서 첫번째로 들었던 생각은 독자 대상이 좀 애매하지 않은가 하는 의문이었습니다. 이 책은 다음으로 나오기는 했지만.. 2021. 3. 23.
이보다 더 쉽지 못할 <신경망 첫걸음> 코세라로 머신러닝 강좌를 듣다가 이해가 좀 힘들어서 예전에 샀던 책을 다시 펼쳐 들었습니다. www.hanbit.co.kr/store/books/look.php?p_code=B1910379076 저 유명한 앤드류 응 교수의 코세라 딥러닝 강좌와는 찰떡궁합이랄까요? 어색한 번역이 섞여서 좀 더 어렵게 느껴지던 부분을 말끔히 해소해 주었습니다. 다만 표지에 적힌 대로 '수포자도 이해하는' 수준까지는 아니라고 봅니다. 휙 어려워지는 지점이 나옵니다. 그래도 완독하시길 바랍니다. 완벽히 이해하지는 못하더라도 신경망이라는 게 잘 돌아가는 개념이라는 사실을 잘 알게 됩니다. 인공지능, 머신러닝과 그리 친하지 않았던 입문자는 바로 구글 텐서플로나 파이토치 책을 잡기보다는 이 책을 후딱 떼는 게 더욱 도움이 되리라 단.. 2021. 2. 3.
내 직업은 자동화 바람으로부터 안전한가? 최근 도로공사 요금계산소 수납원들이 집단으로 해고 당했다가 본사 정직원으로 복귀한 적이 있습니다. 관련 뉴스는 저와 무관하지 않아 매번 착잡한 마음으로 보곤 했습니다. "청소로 일바뀌고 월급 줄고"..해고 피하니 대신 차별? [뉴스데스크] ◀ 앵커 ▶ 집단해고 됐던 도로공사 요금계산소 수납원들이 10년이 넘는 긴 소송 끝에 도로공사 본사 정직원이 됐는데요. 기쁨은 잠시였습니다. 한국도로공사는 이들에게 수납업무 news.v.daum.net 실은 정직원으로 복귀할 거라는 소식에도 착잡한 마음은 가시지 않았는데, 결국 정직원이 되어서도 청소 업무를 하게 되었습니다. 이 사안은 도로공사가 마냥 횡포를 부리는 것만으로 보기는 힘듭니다. 고속도로 요금계산소 수납원이라는 직업은 몇 년 내로 사라질 게 확실하기 때문입.. 2021. 1. 24.
레벨업을 도와주는 <퀀트 전략을 위한 인공지능 트레이딩> 신기한 책을 만났습니다. 퀀트 전략을 위한 인공지능 트레이딩 파이썬과 케라스를 활용한 머신러닝/딥러닝 퀀트 전략 기술 한빛미디어 / 김태헌, 신준호 저 www.hanbit.co.kr/media/books/book_view.html?p_code=B1740090592 그동안 인공지능/머신러닝 입문서를 떼고 나서 심화학습을 하기 위한 책을 찾아 보면 그리 많지 않았습니다. 때문에 캐글 같은 경진대회 참여와 전문업체 취업 외에는 갈고 닦을 방법이 적었습니다. 퀀트 분야도 마찬가지입니다. 엄청나게 수학적(!)이거나 자전소설 같은 느낌을 주는 책을 읽어 본 적이 있습니다. 책 한두 권 읽었다고 그 업계 노하우 등 일하는 방식을 흡수할 엄두는 내지 않았지만 겉핥기조차 쉽지 않았다는 느낌을 받았습니다. 반면 이 책은 .. 2020. 9. 28.
아주 친절한 <핸드온 비지도 학습> 회사에서 인공지능 관련 일을 하기에 (내외부) 현업 고객들이 현장 니즈를 주제로 아이디어를 토의할 때가 있습니다. 얼마 전부터 AI 학습용 데이터를 확보하기가 어렵다는 것은 잘 알게 된 현업이 간혹 비지도 학습으로 해결할 수 있는지 물을 때가 있었습니다. 그냥 이미지 데이터, 그냥 비정형 텍스트 문서 데이터는 많은데, 학습용 데이터로 가공하려면 태깅, 라벨링 작업이 필수적이며 인건비가 상당히 들 수 밖에 없습니다. 때문에 비지도 학습이 데이터가 부족한 현실을 타개하는 돌파구가 되어줄 수 있는지 알고 싶어했습니다. 안타깝지만 비지도 학습이 그런 식으로 도깨비 방망이가 되지는 못한다는 답변을 해야 할 때가 태반이었습니다. 이제까지 제가 일하는 곳은 PCA와 K-Means로 전형적인 비지도 학습만 해보았습니다.. 2020. 8. 24.
꼭 따라 해야 할 <딥러닝과 바둑> 빅데이터 일을 하다가 '알파고' 열풍이 불어닥치는 바람에 인공지능 연구개발팀 매니저까지 하게 됐으면서도 정작 알파고에 대해서는 어느 이상 알아 보지 않았습니다. 저희 팀이 할 수 있는 일에 바빴습니다. 그러던 차에 이 책을 만났습니다. '그래, 이게 있었지.'하는 생각이 들었습니다. 최근 강화학습을 쓸 만한 일이 생겨서 눈에 더 들어 왔나 봅니다. 딥러닝과 바둑 2016년 세상을 공포와 충격에 빠트린 알파고는 알파고 제로에 완패를 당해 쓸슬히 퇴역했다. 이런 알파고의 드라마틱한 역정을 지켜본 개발자라면 한 번쯤 인공지능 바둑봇을 만들고 싶다는 막�� www.hanbit.co.kr 이 책은 내용이 정말 충실한 튜토리얼입니다. 1부 기초, 2부 바둑을 두는 머신러닝 모델 개발 및 배포, 3부 책을 덮고 나서.. 2020. 7. 6.
친절한 교양서 <인공지능 투자가 퀀트> 퀀트라는 직업군에 관심을 뒀지만 자세히 조사하거나 공부할 생각은 못하다가 기회가 되어 읽었습니다. 이전에도 퀀트를 이야기한 책을 산 적이 있는데 책꽂이에 꽂아 두기만 했지만, 이 책은 끊지 않고 읽어 내려갔습니다. 인공지능 투자가 퀀트 인간 대신 돈을 벌어다주는 인공지능 로봇이 있다? 뉴욕 현지에서 활약 중인 한국인 퀀트가 전하는 월스트리트 인공지능 로봇 전쟁 이야기. 대중에게는 알파고를 계기로 인공지능, 빅데이터에 대한 관심이 급물살을 ... www.aladin.co.kr 1부는 퀀트가 생기고 발전한 역사를 다루고, 2부는 독특하게도 퀀트 취업부터 업계에 드리운 명암까지 소설 형식으로 풀어나가며, 3부는 퀀트의 미래를 고찰합니다. 지루할 틈이 없었습니다. 퀀트 입문서는 미묘하게 아니라고 봅니다. 기법 .. 2020. 4. 26.
2020년 3월 챗봇 단상 챗봇 서비스는 계속 늘어납니다. 어차피 안 쓰는 사람은 안 쓰지만 아쉬운 사람은 씁니다. 당장 오늘 저녁에 OO백화점이 몇 시에 닫는지 알고 싶은데, 상담전화는 음악소리만 내보내며 계속 기다리라고만 할 때가 태반입니다. 물론 백화점 홈페이지에서 클릭 클릭해 들어가면 영업시간이 나옵니다. 귀찮죠. 그런데 한쪽 귀퉁이에 있는 챗봇을 열어서 'OO백화점 언제 닫니?' 물어 보면 그정도는 헷갈려하지 않고 정확하게 답해 줍니다. 써보면 편한 챗봇은 win-win입니다. 사람이 아니기 때문에 내가 변심한다고 해서 마음 아파하지 않습니다. 부담이 없습니다. 고객은 편해서 좋고, 기업은 데이터가 남아 좋습니다. 어느 시점에서 대화가 끝났는지 분석하여 다음 기회 혹은 고객에게는 소기의 목적을 달성할 수 있습니다. 아직은.. 2020. 3. 31.
기초부터 GAN까지 짚어주는 <파이토치 첫걸음> 언젠가부터 팀원들이 텐서플로 외에 파이토치를 쓰는 비중이 늘어나서 관심을 갖게 되었습니다. '파이토치 첫걸음'은 꽤 얇은데 딥러닝 기초부터 GAN 실전기법까지 다룬다는 모토를 내세웠기에 혹하여 골랐습니다. 파이토치 첫걸음 딥러닝 구현 복잡도가 증가함에 따라 ‘파이써닉’하고 사용이 편리한 파이토치가 주목받고 있다. 파이토치 코리아 운영진인 저자는 다년간 딥러닝을 공부하고 강의한 경험을 살려 딥러닝의 진입 장벽을 낮출 목적으로 이 책을 집필했다. 파이토치 설치부터 CNN, RNN, 나아가 스타일 트랜스퍼, 오토인코더, GAN 등 최신 연구 결과까지 살펴본다. 같은 어려움을 겪었던 개발자의 마음으로 개념 원리와 구현을 균형 있게 구성하여 쉽게 읽을 수 있다. www.hanbit.co.kr 좀 읽어 보니, 이 .. 2019. 7. 15.
럭셔리 인공지능 서비스는 나올까? 꽤 많은 신기술이 사치품 제작을 통해 완성도를 높였습니다. 스위스 시계, 궁정의상, 도자기 등 이루 말할 수 없을 정도로 사례가 많습니다. 심지어 무기인 총도 유럽 귀족이 관심을 가지면서 사치품을 제작하게 된 무렵에 획기적으로 발전했습니다. 물론 칼도 아름다운 예술품이 많았지만, 총 역시 귀족 취향을 속속들이 반영한 사치품이 나오면서 약점이 많은 기술수준이었으면서도 노하우 축적을 지속할 발판을 마련할 수 있었다고 봅니다. 출처: https://www.metmuseum.org/art/collection/search/26835 여객기도 마찬가지입니다. 2019년 정도의 여객기 대중화 시대에는 상상하기 힘들지만, 1950년대에는 여객기 요금은 비교하기가 쉽지 않지만 2019년에 비해 대략 4~5배 비쌌다고 합.. 2019. 6. 8.
반응형