본문 바로가기
BI/인공지능

ChatGPT의 세상에서 빅테크가 아닌 조직은 무엇을 해야 하는가?

by wizmusa 2023. 4. 15.
2023년 3월 20일에 CJ ENM Data Solution Center Tech Blog에 올렸던 글을 백업차 올립니다.
https://medium.com/@sihyoung.jurn/chatgpt의-세상에서-빅테크가-아닌-조직은-무엇을-해야-하는가-f664c89d3678

 

GPT-3라는 LLM(Large Language Model)이 2020년 6월에 나오고도 큰 반향이 없었다가 최근에 채팅으로 쉽게 쓸 수 있는 ChatGPT가 나오면서 작금과 같은 열풍이 불고 있습니다.

https://www.joongang.co.kr/article/25143293

 

한국에서는 비용이 많이 들어서인지 LLM을 초거대AI라고도 부르는 편입니다. 저 유명한 ChatGPT의 기반인 GPT 모델을 개발한 OpenAI는 Microsoft로부터 100억 달러를 투자 받는 중이고, 독자적인 LLM을 개발하는 LG전자는 3년간 1억 달러를 투자한다고 밝혔습니다. 어지간한 기업과 조직은 남이 만든 LLM을 ‘유료로’ 써야지 자체적으로 만들 깜냥이 없습니다.

 

기업이 ChatGPT와 같은 LLM을 어떻게 써야 하는지에 대해서는 연일 글이 올라오고 있습니다. 이제 LLM을 비롯하여 AI를 어떻게 써야 할지 짚어보고자 합니다. 이전에는 구글로 검색 가능한 자료와 그렇지 못한 자료를 나누어 자료 조사를 수행했다면, 지금부터는 LLM으로 가능한 일과 그렇지 않은 일을 나누어서 일을 시작해야 합니다.

 

  1. 외부로 보내도 되는 자료인가?
    → GPT-3 수준의 오픈소스 LLM도 조만간 나오겠습니다만, IT/개발자 조직이 대기중인 상태가 아닌 한, 이를 엔진으로서 ChatGPT나 여타의 업무 시스템을 개발하는 일은 어렵습니다. GPU 장비를 마련하는 일 또한 쉽지 않을 겁니다. ROI를 산출할 수 있겠습니까? 그렇다면 외부의 상용 AI 서비스를 써야 합니다. 데이터를 밖으로 보내어 AI가 학습하거나 참조해도 되는지 법적으로나 영업적으로나 살펴야 합니다. (이에 문제가 되지 않게 프롬프트를 구성하는 노하우가 있으나, 역시 개발이 필요한 사안입니다.)
  2. AI가 이해할 만한 데이터를 보낼 수는 있는가?
    → 돈을 많이 들인 인공지능이라고 해도 모든 산업에 통달한 전문가가 아닙니다. 데이터를 무작정 던져주면서 의미 있는 걸 찾으라고 하면 (1) 못 찾거나, (2) 데이터를 반복하여 탐색하면서 가설을 세우고 증명하느라 엄청나게 높은 비용을 청구합니다. (LLM 세상에서는 AI가 가설도 잘 세우더라는 연구결과가 나왔습니다.)
  3. 예측이나 최적화 하는 업무인가?
    → 2023년 3월 기준으로 LLM이나 LLM을 기반으로 한 서비스가 계산식을 세우고 풀어주는 데에 능숙하지는 못합니다. 더군다나 머신러닝/딥러닝과 같은 AI 학습을 해야하는 사안이면 못합니다. 그런 기능이 없습니다. 조직 내부에 적재한 데이터로 조직 구성원이 협력하여 만들어야 할 기능입니다.

IT 업계에서는 이미 여러 차례, 여러 분야에서 검증한 사안이 있습니다.

‘개발자에게 업무를 가르치기’와 ‘실무자에게 개발을 가르치기’ 중 어느 쪽이 효과적인가?

 

결론은 ‘둘 다 효과적이다’입니다만, ‘업무를 잘 배우는 개발자’는 적어서 몸값이 정말 높고, ‘개발을 잘 배우는 실무자’는 전자의 개발자보다 훨씬 적어서 (외국에서는) 몸값이 정말 높습니다. 현실적인 방안은 개발자와 실무자가 합심하여 도구를 만들어 실무자가 사용하고 개발자가 운영하는 대개의 잘나가는 조직이 쓰는 방식입니다. 인공지능 역시 마찬가지입니다. 조직 구성원이 AI를 위시하여 상용이거나 자체개발한 크고 작은 IT 기술과 도구(No-code, less-code tool)에 능숙해져야 하고, 이를 지속하는 문화를 갖춰야 합니다.

 

특히 조직이 AI 기술을 통해 경쟁력을 향상하고자 할 때, 사다 쓰는 AI만으로는 부족하므로 조직 내부의 데이터를 활용한 AI 개발이 필요합니다. 엄청난 알고리듬을 개발하기보다는 AI가 학습할 데이터를 확보해야 하며, 일관적이면서 효과적인 데이터와 기준은 조직 구성원이 합의하는 과정을 거쳐야만 가능합니다. 아래 글과 영상을 참고하시길 바랍니다.

AI 사대천왕 앤드류 응, GTC 2022서 데이터 중심 AI 강조 By 박성은
https://byline.network/2022/03/24-182/

 

Auto-translate 기능을 사용하면 한국어 자막을 보실 수 있습니다.

다시 말해, 흔히 이야기하는 데이터과학자만이 AI를 개발하는 건 효용이 적으며 조직 구성원이 합심하여 AI 기반 서비스(혹은 기존 시스템에 들어가는 모듈)를 개발해야 실질적인 성과를 거두게 됩니다. OpenAI사가 GPT-3 ‘모델’을 개발한 다다음해에 ChatGPT ‘서비스’를 출시하여 가시적으로도 성공을 거둔 것처럼, 한두 팀이 아니라 범조직적인 역량을 기울여야 두드러진 성과를 얻게 됩니다. AI 열풍 이전에 이미 성숙한 조직은 각 업무 과정을 최적화한지 오래이기 때문에, 두드러진 변화관리가 인지상정으로 더욱 필수적입니다. 한 번 잘한 경험이 있기에 한 번 더 잘할 수 있습니다. 자신들을 가졌으면 좋겠습니다.

 

반응형