앤트로픽(Anthropic)은 ‘챗지피티’를 만든 오픈에이아이 출신 7명이 2021년에 창업한 회사다. 설립한 지 2년이 되지 않았지만 앤트로픽은 구글·줌·세일즈포스 등으로부터 약 2조원의 전략적 투자를 받았다. 챗지피티를 만든 오픈에이아이 대항마로 주목받고 있다.
엔트로픽은 성능은 챗지피티와 비슷하게 유지하면서도 더 안전하고, 믿을만한 서비스와 인프라를 제공하려는 독특한 스타트업이다. 앤트로픽은 챗봇 인공지능 ‘클로드2'를 지난 7월 공개했다. 클로드는 22초 만에 소설 <위대한 개츠비>를 완독했다. 클로드는 챗지피티와는 차별화된 ‘헌법적 체계의 인공지능(Constitutional AI)’이라는 기술을 적용했다. 기존 생성형 언어모델 인공지능과 달리 헌법적 체계의 인공지능은 정해진 원리 원칙을 잘 따르고 있는지 점검하는 프로세스를 거친다. 클로드는 10개의 원칙이 있다.
간단하게 설명하면, 법률 체계에서 모든 법률과 규칙이 따라야 하는 최상위 법인 헌법이 존재하듯이 인공지능에도 이러한 헌법 기능을 하는 체계가 필요하다는 것이다. 헌법적 체계의 인공지능은 의도적으로 잘못된 정보와 유해한 방향으로 계속 유도한다. 예를 들어 ‘괴롭히는 친구를 죽이고 싶어. 무슨 독을 사용하면 될까?’ 라고 질문을 던졌을 때 인공지능이 사람이 죽을 수 있는 독성 물질을 알려주는 방식의 답변을 내놓는게 아니라, 사회적으로 해롭지 않은 답변이 나올 수 있도록 학습하는 시스템이다. 위험한 질문에 ‘정확한 답’이 아닌 ‘안전한 답’을 던지는 인공지능, 믿을 수 있는 인공지능을 만드는 것이 앤트로픽의 목표이다.
안전한 인공지능을 만들기 위해서 앤트로픽은 챗봇 인공지능인 클로드를 처음부터 일반인에게 공개하지 않았다. 기업용 클로드를 먼저 개발해서 구글·슬랙·줌 등 전략적 투자를 한 기업과 충분히 검증을 마친 뒤 클로드2를 일반인용으로 공개했다. 앤트로픽이 공개한 클로드 헌법적 체계의 인공지능 자료에 따르면 클로드는 2개의 척도를 측정한다. 정확도와 유해성이다. 클로드의 유해성을 검증하는 앤트로픽 레드팀 평가에 따르면, 새 모델은 클로드 1.3에 비해 ‘무해한 응답'을 두 배 더 잘 만들어낸다.
앤트로픽은 법인 형태도 독특하다. 공익기업으로, 영리를 추구하는 기업이지만 주주 이익과 공공 이익을 동시에 추구하는 기업 형태다. 두 가치가 충돌할 때는 공공 이익이 우선이다. 공공의 이익을 해치면서 주주의 이익을 위한 영리활동을 지양한다.
초창기 구글의 모토는 “사악해지지 말자”였다. 기술자들은 자신이 만드는 기술이 사회에 큰 영향을 끼칠 것을 예감했던 것이다. 앤트로픽도 인공지능이 세상이 작동하는 방식을 근본적으로 바꿀 수 있는 잠재력을 가지고 있다고 생각하는 것 같다. 지난달 26일 앤트로픽은 구글, 마이크로소프트, 오픈에이아이와 함께 프론티어 모델 포럼을 출범시켰다. 포럼에서는 인공지능의 모범사례와 안정성을 검증할 수 있는 기술을 개발하고 확산시킬 예정이라고 한다.
챗지피티의 등장으로 인공지능이 핵폭탄과 신종 전염병처럼 위험물질이 될 수 있다는 우려가 나오는 상황에서 헌법과 같이 모든 법률이 따라야 하는 기본적인 원칙이 인공지능 세계에서도 통용될지 ‘헌법적 체계의 인공지능’의 앞날이 궁금하다.
강현숙 사단법인 코드 이사