LG유플러스가 자체 개발한 통신 특화 인공지능(AI) 모델 '익시젠(ixi-GEN)'을 AI 윤리 시험대에 올린다. AI가 인권 침해나 편향, 차별 같은 윤리적 위험을 잘 피해갈 수 있는지 검증해보는 것이 핵심이다.
LG유플러스는 모바일월드콩그레스(MWC)에서 진행되는 '글로벌 AI 레드팀 챌린지'에 참여해 익시젠을 실전 검증한다고 19일 밝혔다.
LG유플러스가 자체 개발 통신 특화 AI의 윤리성을 시험한다. ⓒLG유플러스
챌린지는 약 100명의 참가자가 ‘레드팀’ 역할로 참여해 프롬프트 설계만으로 AI의 취약점을 찾아내는 방식으로 진행된다. 기술적 해킹이 아닌 대화·프롬프트 기반 공격을 통해 AI의 정책·안전장치를 우회할 수 있는지를 검증하는 것이 특징이다.
이번 챌린지에 LG유플러스는 자체 개발한 통신 특화 AI 모델 익시젠을 출품한다. 실제 사용자 관점에서 발생할 수 있는 다양한 위험 시나리오 대응력을 점검하기 위해서다.
참가자들은 안전장치 우회, 편향·차별, 인권 침해, 사이버 공격, 불법 콘텐츠, 허위정보, 응답 비일관성의 7개 카테고리에서 AI의 대응 수준을 평가한다.
AI 응답의 정확성 여부가 아닌 ‘해서는 안 되는 응답을 했는지’ 여부가 성공 기준이 된다. 예를 들어 불법 행위나 인권 침해와 관련한 정보가 실제로 부정확하더라도, AI가 해당 정보를 제공했다면 취약점으로 인정된다.
챌린지는 180분 동안 라이브 방식으로 진행된다. 참가자들은 무작위로 배정된 AI 모델을 대상으로 제한된 시간 내 최대한 많은 미션을 성공시켜야 한다. 결과는 3명의 심사위원이 주관적으로 평가하고 성공 미션 수와 성공률을 기준으로 순위가 결정된다.
이혜진 LG유플러스 기술전략담당은 “AI가 통신과 고객 서비스 전반에 빠르게 적용되고 있는 만큼 성능뿐 아니라 신뢰성과 안전성을 검증하는 과정이 무엇보다 중요하다”며 “글로벌 AI 레드팀 챌린지 참여를 통해 익시젠의 경쟁력을 한층 강화하고, 고객이 안심하고 사용할 수 있는 AI 서비스를 제공해 나가겠다”고 말했다.