지능(매개변수)은 3배 더 똑똑해졌는데, 대답 속도(TPS)는 전혀 줄어들지 않았다. 결과적으로 실전 능력(벤치마크)은 2배 이상 강력해졌다.
'독자 인공지능(AI) 파운데이션 모델(독파모)' 프로젝트 준비에 한창인 김성훈 업스테이지 대표이사가 기존 거대언어모델(LLM)을 개선한 모델을 새로 내놓으며 '에이전트 AI'에 한발 더 다가섰다.
새 모델은 '솔라 프로 3'로, 기존에 개발한 거대언어모델(LLM) '솔라 프로 2'의 처리 속도를 그대로 유지하면서 규모는 3배 이상 키운 것이다. 독파모 프로젝트에 참여한 '솔라 오픈'과 별개 모델이지만, 당장 사용할 수 있는 AI 모델이라는 점에서 실용성이 두드러진다.
김성훈 업스테이지 대표이사가 기존 거대언어모델(LLM)을 개선한 '솔라 프로 3'를 내놨다. 기존 처리 속도를 그대로 유지하면서 규모는 3배 이상 키운 것이다. ⓒ업스테이지
업스테이지는 자체 개발 거대언어모델(LLM) 솔라 프로 3를 24일 공개했다. 매개변수 규모가 310억 개였던 기존 솔라 프로 2에 비해 매개변수 규모가 1020억 개까지 3배 이상 확대된 모델이다. 업스테이지는 규모를 키웠음에도 비용과 처리 속도(TPS)는 동일하다고 설명했다.
매개변수는 AI 모델 내부에서 계산을 통해 데이터의 패턴을 기억하는 '가중치'들의 집합으로, 일반적으로 매개변수가 많을수록 모델의 '이해력'이나 '추론 능력'이 높아진다.
김성훈 대표는 "솔라 프로 3는 단순한 모델 성능을 넘어 실제 업무 환경에서 효과를 낼 수 있는 에이전트 AI 실용성의 도약을 목표로 개발됐다"며 "앞으로도 업스테이지는 업계 최고 수준의 기술력을 바탕으로 실제 산업 현장에서 쓰이는 AI 생태계를 확장해 나가겠다"고 말했다.
업스테이지에 따르면 솔라 프로 3는 성능 면에서 다단계 작업을 수행하는 도구 호출, 복합 지시 이행 등 에이전트 워크플로우 전반을 아우르는 실질적 향상을 보여줬다. 에이전트 종합 성능, 코딩, 지시이행 등 주요 LLM 벤치마크 평가에서 전작 대비 2배 이상 높은 점수를 기록했다.
업스테이지 자체 강화학습 기술 ‘스냅PO’를 적용하면서 에이전트 AI의 핵심인 심층 추론 능력을 고도화할 수 있었다. 단순 답변 생성을 넘어 단계적 사고로 추론의 일관성과 맥락 판단력을 높인 결과, 경시대회급 수학, 대학원 수준 과학 등 고난도 추론 평가에서 높은 성능을 기록했다.
응답 품질도 한 단계 끌어올렸다. 일반 사용자 선호도와 한국어 사용자 선호도 등 주요 평가 지표에서 유의미한 개선을 기록했으며 사용자의 의도와 미세한 뉘앙스까지 정확히 반영해 실사용 환경에서의 체감 품질을 높였다.
솔라 프로 3는 글로벌 AI 모델 서비스 플랫폼 ‘오픈라우터’와 업스테이지 자체 API를 통해 즉시 이용할 수 있다. 대형 모델의 성능을 소형 모델 수준의 비용으로 운용할 수 있어 에이전트 AI 전환을 검토하는 기업과 개발자들의 진입 장벽을 낮출 것으로 보인다.