SKT LLM 개발 타임라인 (사진=SK텔레콤)
[기업뉴스TV=박현진 기자] SK텔레콤이 7년간 쌓아온 한국어 특화 인공지능(AI) 기술력을 바탕으로 독자 개발한 초거대 언어 모델(LLM) 'A.X(에이닷 엑스) 3.1'을 오픈소스 커뮤니티 허깅페이스에 공개했다. 이는 국내 AI 생태계 발전을 위한 노력의 일환이다. 동시에 과학기술정보통신부가 주관하는 '독자 AI 파운데이션 모델 사업' 참여를 위한 컨소시엄을 구성하며, 반도체부터 서비스까지 아우르는 AI 풀스택(Full-Stack) 경쟁력 확보를 통해 대한민국을 대표하는 AI 기업으로 도약하겠다는 강력한 의지를 표명했다.
7년 AI 자립 여정의 결실: 한국어 특화 LLM 개발부터 오픈소스 공개까지
SK텔레콤은 생성형 AI 기술이 전 세계적으로 주목받기 시작한 2018년부터 한국어 중심의 AI 기술 연구를 지속해왔다. 이는 한국어에 최적화된 초거대 언어 모델(LLM)을 독자 기술로 개발하고 운영하며, 국내 AI 생태계의 기술 자립을 이끄는 데 중요한 기반을 마련했다.
SKT의 한국어 AI 기술 역사는 2019년 국내 최초 한국어 딥러닝 언어 모델인 'KoBERT'를 자체 개발해 공개하며 시작됐다. KoBERT는 한국어의 복잡한 조사, 어순, 띄어쓰기 등 언어 구조를 반영하여 문맥 이해와 의미 분석에서 높은 정확도를 보였다. 이후 2020년 4월에는 국내 최초로 GPT-2를 한국어로 구현한 'KoGPT2'를 공개했으며, 같은 해 10월에는 뉴스 및 문서 요약에 특화된 'KoBART'를 출시하며 자연어 처리 역량을 지속적으로 향상시켰다. 이들 주요 모델을 오픈소스로 공개하며 기술 경쟁력을 확보하고 국내 AI 생태계 발전에도 기여해왔다는 평가를 받는다.
개발된 기술은 실제 고객 접점에 적용되며 상용 환경에서의 성능 고도화도 병행됐다. 2022년에는 자체 개발한 GPT-3 기반 한국어 특화 버전을 '에이닷(A.)' 서비스에 적용하여 일상 대화 및 다양한 작업 수행이 가능하도록 구현했다. 이어서 감성 대화에 특화된 'A.X 1' 모델을 추가 적용하며 정서적 교감 기능을 강화했고, 2023년에는 복잡한 문맥 이해와 지식 기반 응답이 가능한 'A.X 2'를 선보였다. 2024년에는 새로운 아키텍처를 기반으로 추론 속도와 전반적인 성능을 향상시킨 'A.X 3.0'을 출시해 에이닷 전화의 통화 요약 기능 및 AI 에이전트 기능에 활용하는 등 상용 서비스에 적용 폭을 넓혔다. 'A.X 1'부터 '3.0'까지 모든 모델은 구조 설계부터 데이터 수집, 학습까지 모든 과정을 SKT가 직접 수행한 '프롬 스크래치(From Scratch)' 방식으로 개발됐다.
AI 풀스택 비전: 독자 파운데이션 모델 개발 및 컨소시엄 활동
SK텔레콤은 최근 매개변수 340억 개(34B)를 기반으로 하는 독자 구축 LLM인 'A.X 3.1'을 오픈소스 커뮤니티 허깅페이스에 공개했다. 이 모델은 A.X 3.0의 개선된 버전으로, 한국어 대화 성능 외에 추론 모델로의 확장 가능성을 고려해 코드와 수학 성능을 대폭 향상시킨 것이 특징이다. SKT는 A.X 3.1 모델 2종(표준, 경량)과 대규모 학습(CPT, Continual Pre-Training) 기반의 A.X 4.0 모델 2종(표준, 경량)까지 총 4개의 모델을 오픈소스로 개방해 학술 연구나 상업적 이용 등에 자유롭게 활용할 수 있도록 했다. A.X 3.1(34B)은 SKT의 A.X 4.0(72B)에 비해 매개변수는 절반 이하지만, 같은 한국어 서비스에 적용될 경우 약 90% 수준의 성능을 발휘하여 효율성을 제공한다.
SKT는 이러한 우수한 LLM 기술 역량을 바탕으로 과학기술정보통신부가 주관하는 '독자 AI 파운데이션 모델 사업'에 지원했다. SKT 컨소시엄은 반도체, 모델, 데이터, 서비스로 이어지는 독자 기술 기반의 풀스택 AI를 구현하고, 개발하는 모델을 국내 AI 생태계의 다양한 기업들에 오픈소스로 개방하는 것을 목표로 한다.
컨소시엄에는 국내 최대 게임 상장사인 크래프톤을 비롯해 모빌리티 데이터 분야의 포티투닷, 추론형 AI 반도체(NPU) 제작사 리벨리온, AI 에이전트 라이너, 데이터 안정성 기술의 셀렉트스타 등 다양한 분야의 기업들이 참여하고 있으며, 학계를 대표하는 서울대학교 및 KAIST 연구진도 함께한다. 또한 SK하이닉스, SK이노베이션 등 SK 그룹사는 물론, SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI 광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등 다수의 기업이 SKT 컨소시엄이 만들어낼 AI 모델 사용 의향서를 제출했다.
SKT 컨소시엄은 자체 개발 LLM인 A.X와 각 참여사의 자체 LLM 및 데이터를 기반으로 대한민국을 대표하는 독자 파운데이션 신규 모델을 개발할 계획이다. 특히 기존 규모를 뛰어넘는 초거대 AI 모델 개발과 더불어, 텍스트뿐만 아니라 이미지, 음성, 비디오 등 다양한 형태의 데이터를 통합 처리할 수 있는 '옴니모달(Omni-Modal)' 기술을 적용할 예정이다. 또한 현재 AI 업계 표준으로 자리 잡은 트랜스포머 구조를 넘어선 혁신적인 신규 구조 연구도 추진하여 글로벌 AI 경쟁에서 대한민국만의 독자적인 기술 경쟁력을 확보한다는 목표다.
SK텔레콤 김태윤 파운데이션 모델 담당은 "각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것"이라며 "국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획"이라고 밝혔다. SKT는 '프롬 스크래치' 방식의 A.X 3 계열 모델과 대규모 학습(CPT) 방식의 A.X 4 계열 모델을 병행 개발하는 '투 트랙 전략'을 통해 다양한 서비스 환경에 최적화된 AI 모델 포트폴리오를 지속적으로 확장해 나가며, 초거대 AI의 산업화와 일상화를 선도해나갈 방침이다.