본문 바로가기
BI/인공지능

NVIDIA GTC 2022에서 선보인 Megatron-Turing NLG 530B

by wizmusa 2022. 3. 23.

한국 시간으로 3월 21일부터 24일까지 NVIDIA GTC 2022가 열립니다.

 

GTC 2022: #1 AI Conference

Register FREE. Streamed online. March 21-24, 2022.

www.nvidia.com

  • New Silicon — NVIDIA H100: A “New Engine of the World’s AI Infrastructure”
  • New Software — AI Has “Fundamentally Changed” Software - 60개의 SDK 업데이트 공개, NVIDIA AI platform, NVAIE 2.0
  • ‘The Next Evolution’: Omniverse for Virtual Worlds - 디지털 트윈 구축을 위한 NASA와 아마존 사례 공개
  • The ‘Next Wave of AI’: Robots and Autonomous Vehicles - NVIDIA Avatar, DRIVE, Metropolis, Isaac and Holoscan

GPU가 세상을 바꿀 줄은 몰랐던 저로서는 세션 하나 하나가 신기하기만 합니다. 새로움이 줄지를 않는군요.

 

 

NVIDIA, Hopper 아키텍처의 H100 GPU 발표 | GeekNews

GTC 2022에서 차세대 Hopper™ 아키텍처 와 그 기반의 H100을 발표.→ Grace Hopper의 이름을 따서 명명. Ampere 아키텍처를 계승대규모 AI와 HPC를 가속하는 6개의 기술 혁신TSMC 4나노 공정으로 800억개의 트

news.hada.io

새로운 GPU인 H100이 등장했는데, (저희 팀이 쓰는 V100 → A100 → H100) 성능이 좋아진 거 외에(이전 세대보다 7배 향상) confidential computing이라는 고객 데이터 보호 기능도 내장했다고 합니다. NLP(자연어처리), 텍스트 분석에 특화한 기능으로, 실제로 NVIDIA는 초거대AI 언어모델 Megatron-Turing Natural Language Generation을 MS와 함께 (아마) Azure 클라우드 기반으로 만들었습니다.

 

 

MS와 Nvidia가 세계 최대규모 언어 모델 MT-NLG 530B를 발표 | GeekNews

- Megatron-Turing Natural Language Generation- GPT-3의 1750억개보다 큰 5300억개의 파라미터- 기존과 비교되지 않는 정확도를 보임 ㅤ→ 문장 완성, 이해력, 상식적인 추론, 자연어 추론 등- 105개 레이어, 트랜

news.hada.io

OpenAI가 만들었던 GPT-3의 1,750억개 파라미터보다 큰 5,300억개 파라미터로서 기존과 비교하지 못할 만큼 정확도를 자랑한다고 합니다. 영어나 서양언어에 국한하겠지요. GPT-3에는 영어가 92.7%, 한국어는 0.02% 정도만 들어갔다고 하니 그리 다르지는 않을 듯합니다.

2022년 3월 시점에서는 Megatron-Turing NLG 530B가 제일 큰 언어 모델이다.


장기적으로 NLP, TA 분야는 빅 플레이어가 클라우드 기반으로 제공하는 초거대 언어 모델을 fine tuning 하는 방향으로 흘러가지 않을까 합니다. 네이버와 카카오가 지금처럼 잘 만들어서 앞으로도 저렴하게 서비스해 주길 바랍니다. 😉 그렇지 않다면 NIA 같은 공공기관이 나서는 것 말고는 방법이 없겠습니다. 저건 중소, 중견기업이 따라 할 수 있는 수준이 절대 아니군요. 그런데 2022년 기준으로 한국어 NLP 업계는 워낙 정규식 활용 비중이 커서 금세 바뀌지는 않을 듯합니다. 🤔 

반응형

'BI > 인공지능' 카테고리의 다른 글

시맨틱 데이터 모형화를 고객도 이해하게 하려면  (0) 2022.04.24
공인은 감내해야 할 AI  (0) 2022.03.18
통계는 강력해  (0) 2022.03.17