본문 바로가기

경제신문스크랩

경제신문스크랩 - 네이버AI

네이버 AI "뭐라카노" 사투리까지 척척

https://news.naver.com/main/read.nhn?mode=LPOD&mid=sec&oid=009&aid=0004799226

 

#기사본문

세계최대 한국어 언어모델 구축

슈퍼컴으로 '하이퍼클로바' 개발

한국어 데이터 학습량도
글로벌표준보다 6500배 많아
네이버 "모두를 위한 AI 될 것"

LG·SKT·KT도 잰걸음

네이버가 '초대규모 인공지능(AI)'을 표방한 '하이퍼클로바'를 선보였다. 전 세계에서 가장 큰 한국어 언어 모델이다. 인간처럼 생각하고 자연스럽게 대화하는 AI의 등장이 초읽기에 들어갔다는 분석이 나온다.

네이버는 25일 온라인으로 연 '네이버 AI 나우' 콘퍼런스에서 자체 개발한 초대규모 AI인 하이퍼클로바를 공개했다. 하이퍼클로바는 2040억개 파라미터(매개변수)를 갖췄다. 미국 OpenAI가 작년 공개한 초대규모 AI 언어 모델로, 글로벌 표준으로 불리는 GPT-3(1750억개)를 능가하는 수준이다. 정보를 연결하고 이동시켜주는 파라미터가 많을수록 AI 모델이 커지고 AI 지능이 높아진다.

하이퍼클로바는 세계 최초 한국어 초거대 언어 모델이라는 점에서 의미가 있다는 평가다. 초거대 언어 모델은 현재 영어만 상용화됐다. 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 많이 학습했다. 학습 데이터 중 한국어 비중이 97%에 달한다. 정석근 네이버 클로바CIC 대표는 "영어 중심의 AI 모델과 달리 한국어에 최적화한 언어 모델을 개발함으로써 AI 주권을 확보한다는 의미가 있다"고 말했다.

활용 분야는 무궁무진하다. 그간 AI는 데이터 양 부족으로 A라는 질문에 B라고 답하는 식의 단순 대화만 가능했다. 하이퍼클로바를 활용한 AI는 대화 맥락을 이해하면서 질문에 대한 답을 작문할 수 있다. 인간처럼 고차원적 대화까지 가능해진다. 번역 정확도가 한층 높아지고, 글 스타일도 자유자재로 바꿀 수 있다. 예컨대 경상도 사투리로 쓴 글을 몇 차례 학습만으로 전라도 사투리 버전으로 바꿀 수 있다.

네이버는 하이퍼클로바 기반의 AI 서비스 첫 사례로, 검색어를 잘못 입력해도 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 최근 도입했다. 네이버 관계자는 "하이퍼클로바를 활용해 대화, 번역, 문장 생성, 요약, 기계 독해 등 다양한 AI 기술을 개발할 수 있고 이들을 조합해 다양한 서비스를 만들 수 있다"고 설명했다. 네이버는 향후 영상이나 이미지 등도 이해하는 '멀티모달 AI'로 하이퍼클로바를 발전시킬 계획이다.

네이버는 하이퍼클로바를 활용해 전문가가 아니어도 누구나 AI 서비스를 만들 수 있도록 지원할 방침이다. 초대규모 AI 특성상 하이퍼클로바는 간단한 설명과 예시를 제시하는 '소수 학습' 방식으로 AI를 동작시킬 수 있다. 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주거나, 공부해야 할 내용을 AI가 빠르게 요약하고 모르는 내용을 질문했을 때 자연스럽게 답변해주는 기능 등을 구상하고 있다.

더 똑똑한 AI를 개발하기 위해 '데이터 규모'가 핵심 경쟁력으로 떠오르면서 국내 대기업들도 초거대 AI 개발에 뛰어들고 있다. 네이버가 작년 10월 미국 엔비디아가 개발한 슈퍼컴퓨터 '슈퍼팟(Superpod)'을 도입해 초대규모 AI 개발에 나선 것과 달리 국내 다른 기업들은 클라우드와 같은 '우회로'를 선택하는 추세다.

LG그룹은 약 1200억원을 들여 초거대 AI를 개발해 올 하반기 공개한다. 수많은 컴퓨터와 클라우드를 연결해 하나의 시스템을 구축할 예정이다. SK텔레콤도 카카오와 AI 기술로 언어 모델 공동 개발을 추진하고 있다. SK텔레콤 관계자는 "고성능 인프라스트럭처 구축을 위해 다양한 방안을 검토하고 있다"고 말했다. KT는 카이스트(KAIST)와 연내 초거대 AI 연구를 위한 'AI·SW 기술 연구소'를 출범시킨다. KT는 대덕2연구센터 내 200평 공간에 전용 GPU 서버팜을 구축할 계획이다. 정보기술(IT) 업계 관계자는 "이미 구글, 페이스북 등 글로벌 빅테크 기업들은 초거대 AI 모델이 가져올 혁신 서비스에 주목해 투자를 늘리고 있다"며 "국내 기업도 이런 흐름에 주목한 것"이라고 말했다.

 

#근거(객관적 수치)

네이버는 25일 온라인으로 연 '네이버 AI 나우' 콘퍼런스에서 자체 개발한 초대규모 AI인 하이퍼클로바를 공개했다. 하이퍼클로바는 2040억개 파라미터(매개변수)를 갖췄다. 미국 OpenAI가 작년 공개한 초대규모 AI 언어 모델로, 글로벌 표준으로 불리는 GPT-3(1750억개)를 능가하는 수준이다.

 

하이퍼클로바를 활용한 AI는 대화 맥락을 이해하면서 질문에 대한 답을 작문할 수 있다. 인간처럼 고차원적 대화까지 가능해진다. 번역 정확도가 한층 높아지고, 글 스타일도 자유자재로 바꿀 수 있다. 예컨대 경상도 사투리로 쓴 글을 몇 차례 학습만으로 전라도 사투리 버전으로 바꿀 수 있다.

 

#추가 조사내용

1. 네이버 AI 나우

2021.05.25에 개최된 온라인 AI 컨퍼런스

 

2. GPT-3(Generative Pre-Trained Transformer 3)

GPT-3는 핵심어만 몇 개 넣으면 알아서 문장으로 만들어주는 기술인데, 500자 중문에서 일반 성인과 비슷한 수준으로 글을 만들어낸다. GPT-3은 기존 GPT–2의 개량 모델로 방대한 양의 데이터셋(3000억 개의 토큰)과 매개변수(1750억 개)를 갖춘 자연어 모델 기반의 딥러닝 시스템이다.

 

GPT-3는 문자 데이터 내에서 목적에 맞는 데이터를 특정 패턴과 순서에 맞게 골라 가공하는 데이터 파싱(parsing) 능력을 보유. 그래서 맥락에 맞되 보다 과장된 표현을 쓰라는 명령을 GPT-3에 하면 단순히 기존 단어를 재배열하는 수준을 넘어 각종 단어를 바꾼 다음 완전히 새로운 문장을 만들 수도 있다고 한다. 이런 기능을 활용해 GPT-3는 이력서 등 용도에 적합한 문서를 작성하는 모습도 보여준다.

 

3.멀티모달 AI

『 멀티모달 』

멀티 모달(Multi Modal)은 여러 가지 형태와 의미로 컴퓨터와 대화하는 환경을 뜻한다.
‘모달’은 모달리티(modality)를 의미하는데 ‘모달리티란 인터랙션 과정에서 사용되는 의사소통 채널’을 가리킨다.
멀티 모달 인터페이스는 전통적 텍스트 외에 음성, 제스처, 시선, 표정, 생체신호 등 여러 입력 방식을 융합하여 인간과 컴퓨터 사이에 자연스런 의사소통이 가능한 사용자 친화형(user- friendly) 기술로서 과거의 기계 중심 입력에서 현재는 휴먼 중심의 자연스러운 입력 방식으로 변화하고 있다.

 

『 멀티모달 AI 』

멀티모달 인공지능은 인공지능 중 하나이며, 복잡한 과제 해결 및 높은 정확도를 달성하기 위해 다양한 데이터 종류 (텍스트, 음성, 이미지, 수치형 데이터)와 스마트 처리 알고리즘을 결합했다. 

 

#적용할 점(현직자에게 물어볼 점)

1. 요즘 AI에 대해 많은 회사들이 관심을 가지고 있는데 조심해야할 점은 없는가?

2. 하이퍼클로버는 GPT-3보다 한국어데이터가 많은데 그 외에 다른 경쟁성은 없는가? 

 

#참고자료

NAVER AI NOW

GPT-3란 무엇인가

"맛집 알려줘"…컴퓨터와 대화하세요

멀티 모달 인공 지능 (Multimodal AI)