본문 바로가기

전체 글740

보기 드문 주제를 다룬 '대규모 머신러닝 시스템 디자인 패턴' 대규모 머신러닝 시스템 디자인 패턴14가지 패턴으로 분산 머신러닝 파이프라인 구축하기저자: 위안 탕,  번역: 정민정 / 한빛미디어 / 2024-11-29https://www.hanbit.co.kr/store/books/look.php?p_code=B3893502217 MLOps 엔지니어를 꿈꾸거나 경력 관리 차원에서 검토했다면 필독서입니다. Python으로 예시 모델을 학습할 줄 알고 쿠버네티스를 사용해 봤어야 이 책을 이해하기 녹록합니다. 실습을 다룬 장은 뒤에 몰려 있습니다. 패턴 개념 설명과 실습을 교대하는 구성이었다면 어땠을까 하는 아쉬움이 있습니다. 이렇게 생각한 이유는 제 경력이 개발자보다는 BI 개발자와 데이터 엔지니어에 치우쳐서일 수 있습니다. 개발 디자인 패턴에 익숙한 개발자는 이 책의.. 2024. 12. 30.
인공지능은 예술을 할 수 있는가 이세돌 기사가 은퇴한 이유를 밝혔습니다. 보드게임으로 느껴지기 시작한 바둑을 계속하고 싶지 않았다고 합니다. 그때까지 이세돌 기사가 바둑을 보드게임으로 보지 않았던 이유는 여러 가지가 있겠습니다만, 저는 랜덤에 좌우되지 않는다는 점에 비중을 둡니다. 만화 '미생'에도 유사한 맥락인 장면이 나옵니다.  바둑은 대국을 같이 두는 사람과 함께 완성하는 예술이라고 작가는 말했습니다. 때문에 이세돌 기사는 서로 의도를 확인하는 '복기'에 의미를 크게 두었습니다. 아직까지 인공지능 알파고는 계산하여 모범답안을 내놓을 뿐입니다. 승패를 가른 이후에 인간 기사와 나눌 이야기가 없습니다. 애초에 AI에게 기대할 일이 아니기도 합니다. https://www.kmib.co.kr/article/view.asp?arcid=09.. 2024. 11. 27.
ChatGPT는 무슨 자리를 차지하고픈 걸까? 집에 네이버 클로바 스피커를 둔 지 오래입니다. 매일 날씨를 묻거나 세탁기 남은 시간을 물으며 쏠쏠하게 사용해 왔습니다. 몇 년째 날마다 말을 걸었어도 사람같다고 여긴 적은 없습니다. 반면 ChatGPT는 말을 끊지 않는 한 대화를 계속 이어나가는군요. '얘'가 왜 이러지라는 생각을 하고 말았습니다. 뉴스앤올디스 2024년 11월호 - 고양이가 사람 말을 알아듣는다? 그리고 중세 사혈요법의 실체 - ChatGPT 대화는 8:58부터 시작합니다.https://youtu.be/c-3lKQxOFyI?si=SU7XG3aQlqLh4c0o&t=538 링크를 클릭하면 ChatGPT 대화 장면에서 바로 시작합니다. 스마트/AI 스피커 개발자나 기획자 강연에서 스피커를 두고 넋두리하는 사람들 사례를 들었습니다. 스피커가.. 2024. 11. 26.
아이디어 불패의 법칙 완독 아이디어 불패의 법칙구글 최고의 혁신 전문가가 찾아낸 비즈니스 설계와 검증의 방법론알베르토 사보이아 저자(글) · 이지연 번역 / 인플루엔셜 / 2020-03-30https://product.kyobobook.co.kr/detail/S000001934097 프로토타입, 프리토타입(pretotype) 말장난은 아니겠지 하는 의구심을 억누르고 읽었습니다. 꽤 오래 전에 읽었다가 이제서야 후기를 썼네요. 검증 가능한 숫자로 말하기 위해서 '나만의 데이터'를 모으라는 조언이 현실적으로 와닿았습니다. 데이터를 모으기 위해 투자를 받아야 한다는 당위성 설명도 인상깊었습니다. 그렇게 의미 있는 회수로 프리토타입을 진행하여 데이터를 확보해야 '될 만한 놈'을 찾아 완성할 가능성이 높아집니다. 역시나 쉽지 않겠습니다. .. 2024. 11. 25.
2024년은 예상보다 훨씬 더 AI 발전 초기일지 모릅니다 우리는 전화 벨소리, '여보세요(Hello, 모시모시)'가 아주 자연스럽습니다만, 전화 개발 초기에는 계속 연결이 된 상태로 있어서 전화를 받으라고 고함을 질러 알리기도 했다고 합니다. 인공지능은 잘 발달한 통신과 정보기술 인프라 경험을 바탕으로 빠르게 완성도를 높였습니다. 그럼에도 전화처럼 발명자 의도와는 다른 방향으로 엄청나게 발전할 가능성은 충분합니다. 벨 연구소 이야기존 거트너 지음, 정향 옮김 / 살림Biz / 2013-02-07https://ebook-product.kyobobook.co.kr/dig/epd/ebook/E000003105143 그레이엄 벨은 전화가 수다를 떠는 수단으로도 쓰이는 추세를 경멸했고, 통신보다는 방송에 의중을 두고 있었습니다. 전화기술을 통해 공연을 중계하는 체계를 .. 2024. 11. 24.
찰리 푸스 모건과 천리포 수목원 음성인식(Speech-to-Text, STT) AI를 구현하는 방식은 여러 가지가 있으며, 일종의 어휘 사전을 갖가지 형태로 가지고 있는 편입니다. 그 사전에 없는 어휘는 알아 듣지 못한다고 봐도 무방합니다. 사람도 비슷합니다. '천리포 수목원'이라는 어휘를 들어본 적이 없는 사람은 '찰리 푸스 모건'이라고 희한하게 알아들을 수도 있습니다.  물론 인간은 아는 말만 알아듣지는 않습니다. 새롭게 배워나갈 수 있습니다. '찰리 푸스 모건'이 아니라 '천. 리. 포. (쉬고) 수. 목. 원.'이라고 음성으로 알려주면 문맹이 아닌 이상 음성과 글자 모두 기억하게 됩니다. 그게 2024년 AI와 인간의 음성 인식 능력 차이라 하겠습니다. 이 차이가 언제 좁혀질까요? 인류에게 유해한 가치관을 배우지 못하도록 하기 .. 2024. 11. 23.
Job death valey만이 아니라 Company death valey가 걱정스럽다 기본소득같은 사회안전망이 없는 환경에서 AI를 적용하기 시작하면 사회 전반적인 구매력이 사라져서 AI를 적용하고 직원을 해고한 기업도 망하게 될 겁니다. 2024년 한국이 다른 나라에 비해 한참 경제가 침체되는 바람에 여력이 사라져서 해고만 발생하고 AI가 두드러져 보이지 따름이지, 미국같은 나라는 여러 분야 별로 AI 솔루션들이 등장하여 해고 행렬이 늘어나고 있습니다. 파는 기업만 남고 살 수 있는 사람은 사라지면 경제가 돌아갈 리가 없습니다. 다들 눈치만 보고 있는 와중에 그 어떤 기업도 자중하지 못하고 마냥 사람을 자르다가 '공유지의 비극'처럼 같이 망하고 마는 게 아닐까 걱정스럽습니다. 이걸 해결할 주체는 누구일까요?  모범답안은 사실 나와 있습니다. AI로 일자리를 잃었다가 지원을 받아 다시 일.. 2024. 11. 22.
인터넷 트래픽은 몇 %가 인간일까? 2022년부터 전 세계 인터넷 트래픽의 절반이 봇이라는 조사가 있습니다. 인류공영에 불가피한 트래픽은 얼마나 될까요? 별로 없겠지요.2024~2036년 글로벌 시장 규모, 예측 및 추세 하이라이트(Abhishek Verma. Research Nester. 2023/11/28/.)https://www.researchnester.com/kr/reports/bot-mitigation-market/5413전 세계 인터넷 트래픽의 절반 가까이가 ‘봇’에서 비롯됐다(박지윤. 시사복지. 2024/04/18/.)https://www.kbj.or.kr/전자·it·통신/전-세계-인터넷-트래픽의-절반-가까이가-봇에서-비롯/33/ 스패머 봇이 유독 많은 트위터에는 얼마 전부터 뭔지 모를 봇 계정이 대거 등장했습니다. 납치 링.. 2024. 11. 21.
상용 서비스에 쉽사리 넣기 힘든 인공지능 예전(!) 인공지능 기술로는 인터넷에 올라온 글이 어떤 주제를 논하거나 키워드를 도출하거나 긍부정 감성 분류를 할 때에 문맥을 감안할 방법이 딱히 없었습니다. 이제는 LLM(Large Language Model)이 있으니 정확도를 획기적으로 높일 수 있습니다. 그러나 그렇게 해야 할까요? 트위터만 해도 이제는 하루에 1.5억 건 이상 글이 쌓입니다. GPU 컴퓨팅에 10원만 들어도 카테고리 분류에만 하루에 15억 원이 들게 됩니다. 실제로는 건당 10원 이상 들 겁니다. 고작 카테고리 분류에만 15억 원 이상을 쓰는 게 합당할까요? LLM 외에도 언어 모델이 나오기 이전에는 달리 방법이 없어 규칙을 만들어 어떤 어휘가 얼마나 들어있거나 들어 있지 않느냐에 따라 결과를 어떻게든 만들었습니다. 그러다 보니.. 2024. 11. 20.
광고만 볼 이유가 없잖아요 전철 안의 전광판은 쓸 데 없는 정보만 보이는 것으로 악명을 떨치고 있습니다. LCD 스크린 기술이 발전하여 단가가 낮아지면서부터 전철 안은 LCD 스크린 광고판으로 도배가 되는 가운데, 광고판 기획은 참으로 의아한 수준입니다. 고작 내 물건 사라는 광고밖에 없는데, 이 어마어마한 스마트폰 세상을 사는 고객님이 무익한 전광판을 볼 이유가 대체 어디 있단 말입니까? 어디 은수저 낙하산이 강림하셨나 싶습니다.   전철을 타고 목적지로 가는 데에 유용한 정보가 담겨야 스마트폰에서 눈을 떼서 정보를 담은 광고도 같이 보게 되는 게 자연스럽지 않나요? 물론 저 전광판에 네트워크 모듈과 적당한 컴퓨팅 모듈을 달면 인프라 비용이 오른다는 건 알겠습니다. 그래도 무려 인프라를 깔면서 잔돈을 아끼기 보다는 광고 효과를 .. 2024. 11. 19.
인공지능을 쉽게 시작할 수 있는 엘라스틱 서치 지난 11월 13일에 Elastic Search hands on 세미나가 있었습니다. 주로 Kibana를 통해 머신러닝 기능을 실습했습니다. Kibana는 대시보드 솔루션이었는데, 이제는 엘라스틱 서치에 모이는 데이터를 분석하는 기능이 제법 많아졌습니다. 인공지능 모델을 사용하는 기능까지 들어갔으니 BI(Business Intelligence) 솔루션에 든다고 해도 손색이 없어 보입니다.평소에 데이터를 축적하고 모니터링하면,각종 알람을 수행할 임계치를 조정할 근거를 마련한다.인프라 Capacity 계획에 있어 명확한 근거를 마련한다. (예: 내년에 서버를 더욱 늘려야 하는가 여부)Anomalousness (변칙성)판단이 모호한 Grey 영역에 대한 고민을 줄여주고자 한다.Elastic search는 fe.. 2024. 11. 18.
생성형 AI 도둑질에 대항하는 사람들 생성형 AI 열풍을 맞아 남이 만든 이미지를 멋대로 가져가 학습 데이터로 써먹는 도둑이 늘어났습니다. 심지어는 원작자에게 어차피 도용 당할 거 정식으로 넘기라는 망종이 등장하기도 했습니다. 이런 도둑질에 대항하는 사람들이 나오고 있습니다.   첫째는 Glaze(https://glaze.cs.uchicago.edu/)입니다. 이미지를 생성형 AI가 쉽사리 모방하지 못하도록 처리합니다. 글레이즈로 처리한 이미지는 학습해도 유사한 스타일로 이미지를 생성하지 못합니다. 둘째는 Nightshade(https://nightshade.cs.uchicago.edu/)입니다. 나이트셰이드는 한 발 더 나아가 이미지 생성형 AI 모델 자체를 망가뜨리기를 목적으로 합니다. 둘 다 사람은 알아보지 못할 흔적과 신호를 이미지에.. 2024. 11. 17.
Ignite Seoul 2024에서 발표했습니다. 지난 2024년 11월 15일 금요일 오후 7시에 한빛미디어 리더스홀에서 행사가 있었습니다.   모든 발표 슬라이드와 동영상이 공유 되었습니다.발표 동영상 재생목록https://www.youtube.com/playlist?list=PL4QsXCF3YN7sQO1SKEWk-SUw6dUBlljen슬라이드 다운로드https://drive.google.com/file/d/1T-gPetcQDNyDoioh8B5meBzXOMrcX8ry/view?usp=sharing저는 '경험을 기록하여 리스크를 낮추는 AI 플랫폼'이라는 주제로 발표했습니다. IT 업계 바깥에 계신 분들이 많을 터라 나름 보편적인 이야기로 풀어 나가고 싶었습니다. Ignite Seoul(https://www.facebook.com/Igniteseou.. 2024. 11. 16.
당신은 준비되었는가 묻는 듯한 'IT 트렌드 2025' IT 트렌드 2025 새로 쓰는 AI의 미래와 세계 비즈니스 모델의 모든 것 저자: 김지현 / 크레타 / 2024-10-08 https://product.kyobobook.co.kr/detail/S000214304606 저자는 오래 전부터 시간관리법(https://product.kyobobook.co.kr/detail/S000000560073)을 위시하여 스마트하게 일하는 법에 대해서도 책을 쓰기도 했습니다. 꽤 오래 됐지만 관련하여 아웃룩이나 다른 도구를 쓰는 방법을 강연하기도 했습니다. 강연을 보면서 인생을 참으로 짜임새 있게 사는구나 감탄했습니다. 이 책 역시 짜임새가 탄탄합니다. 신문에 흔하게 나오는 키워드부터 소개하고, 최근 기술 트렌드와 그러한 트렌드 이끄는 글로벌 빅테크 기업의 움직임을 설명.. 2024. 11. 15.
검색보다 AI 질문을 택할 수밖에 없겠어요 생성형 AI가 계속 발전하면서 이제 검색의 시대는 끝났다는 얘기가 자주 나옵니다. 저만 해도 구글 검색으로는 헤매기만 하다가 Claude.ai에게 질문하여 답을 찾아냈습니다. 기존 검색이 패러다임을 바꾸지 않는 한, 사람들은 헛소리가 섞여도 답처럼 보이는 걸 바로 주는 생성형 AI 서비스에게 의존하겠구나 싶습니다. 제가 궁금해 했던 건 'jewelry'를 [jool-ree]나 [jool-a-ree]로 부르는 현상이 얼마나 흔한지였습니다. 단순한 mispronunciation이 아니라 현상으로 불릴 만큼 흔한 발음 사례로는 알고 있었습니다. 예전 영어 수업 때에 배웠던 내용인데 노트를 분실하여 무려 20년을 궁금해 하던 중이었습니다. 현상의 이름을 알면 되겠다 싶어 띄엄띄엄 검색해 왔건만 도무지 찾지 못했.. 2024. 11. 14.
AI 흔적 찾기도 공모하면 어떨까요? 한강 작가의 노벨문학상 수상 쾌거 후에 처음 여는 신춘문예에 특기할 만한 소식이 두 가지 있었습니다.상금 5000만원, AI 활용 여부 체크… 신춘문예도 시대 변화 반영 (최승영. 기자협회보. 2024/11/12.) https://v.daum.net/v/20241112193747085 노벨문학상 작가를 배출했던 위상에 따라 상금을 올렸고, 기술 변화에 따라 AI 활용여부를 체크한다고 발표했습니다. 두루 합당하다고 봅니다. 다만, AI 활용여부를 어떻게 검사할지 궁금하고 걱정스럽습니다. 검사 프로그램을 하나 구매해서 돌리려는 걸까요? 일단 그렇게 하되, AI 흔적 적발 경진대회를 하면 어떨까 합니다. 프로그램 한두 개로 잡지 못할 얌체를 잡아낼 수도 있고, 얌체가 접근을 포기하는 계기가 되지 않을까 합니다.. 2024. 11. 13.
모두 다 지원하겠다는 DBMS 강자들 한 2년 전만 해도 응용프로그램 요구사항에 따라 RDBMS와 NoSQL을 병용하는 게 비용효율적이라고 제언했습니다. 물론 인사가 만사라 각 DB를 두루 잘 쓰는 사람이 조직에 있어야 가능합니다. 요즘 들어서는 이렇게 얘기하지 않는 편입니다. 어지간히 여력 있고 규모 있는 조직이 아니면 두루 잘할 사람을 구하거나 키우기가 어려웠고, 무엇보다 각 DB들이 너무나 막강해졌기 때문입니다. 빅데이터와 NoSQL 열풍이 불면서 CAP 이론 도해를 발표자료 서두에 넣어 이야기를 풀어 나가던 시절이 있었습니다. Consistency(일관성), Availability(가용성), Partition tolerance(파티션 허용) 세 가지를 한꺼번에 충족하는 솔루션은 없고 용도에 따라 두 가지만 충족하는 솔루션을 선택해야 .. 2024. 11. 12.
인간이 뇌에서 돌리는 모델은 몇 개나 될까? 여전히 인간은 인공지능보다 현실을 잘 파악합니다. 인간이 뇌에서 돌리는 모델 하나와 단일 기능만 수행하는 AI 모델 하나가 겨룬다면 대체로 AI 모델이 이길 겁니다. 그러나 2024년 기준으로 인간은 인공지능을 아주 잘 속일 수 있습니다. 인공지능은 생물이 아니기 때문입니다. 이 노릇을 어떻게 해야 할까요? Embodied AI model을 통해 로봇과 AI가 완전무결해질 때까지 기다리면 되는 걸까요?  위 이미지에 나온 사례를 좀 설명해 보겠습니다. 도로 바닥에 가분수 형태로 사람 형상을 그려 놓습니다. 그러면 자동차에 부착한 카메라 관점에서는 사람이 서 있는 모양처럼 보입니다. 자동차에 내장한 AI는 사람을 치지 않기 위해 긴급하게 제동합니다. 사람은 어떨까요? 사진이 아니라 그림이라는 판단을 합니다.. 2024. 11. 11.
반응형