구글 제미나이 3프로의 '초격차' 선언
'인류의 마지막 시험' 서 정답률 37.5%기록해 GPT-5.1 압도
[CEONEWS=전영선 기자] 구글 '제미나이'가 2년만에 '챗GPT'를 꺽었다. 2023년 2월 8일, 프랑스 파리. 구글의 야심작이었던 생성형 AI '바드(Bard)'가 시연 도중 제임스 웹 우주망원경에 대해 틀린 답변을 내놓자 전 세계가 비웃었다. 그날 하루에만 구글(알파벳)의 시가총액은 1000억 달러(약 130조 원)가 증발했다. 당시 실리콘밸리는 3개월 앞서 챗GPT를 내놓은 '다윗' 오픈AI가 '골리앗' 구글을 무너뜨렸다고 평가했다. 검색 제왕의 몰락은 기정사실처럼 보였다. 하지만 그로부터 2년여가 지난 지금, 상황은 180도 반전됐다. 잠자던 골리앗은 단순히 깨어난 것을 넘어, 경쟁자가 쳐다보기도 힘든 '초격차'를 벌리며 귀환했다. 최근 공개된 구글의 최신 모델 '제미나이 3 프로(Gemini 3 Pro)'가 그 주인공이다.
■'인류의 마지막 시험'이 증명한 격차
이번 AI 패권 경쟁의 승패를 가른 결정타는 벤치마크 결과였다. 특히 AI의 고차원적 추론 능력을 검증하기 위해 설계된 '인류의 마지막 시험(Humanity's Last Exam)'에서의 결과는 충격적이었다. 이 테스트는 생물학, 물리학, 고급 수학 등 단순 검색으로는 풀 수 없는 고난도 문제 2,500개로 구성된다. 여기서 오픈AI의 최신작 GPT-5.1은 26.5%의 정답률을 기록했다. 반면, 구글의 제미나이 3 프로는 37.5%를 기록하며 경쟁사를 10%포인트 이상 따돌렸다. 직전 모델인 제미나이 2.5 프로(21.4%)와 비교하면 비약적인 '퀀텀 점프'다. 월스트리트저널(WSJ)은 이를 두고 소설 <모비딕>의 첫 문장("Call me Ishmael")을 인용하며 "이것을 미국의 차세대 AI 모델로 부르리라"고 극찬했다. 이는 단순한 성능 개선이 아닌, AI가 인간 전문가 수준의 추론 능력에 도달했음을 알리는 신호탄으로 해석된다.
■제미나이 3 프로 vs GPT-5.1: 무엇이 달랐나
그렇다면 현존 최강의 두 AI 모델은 구체적으로 어떤 차이를 보일까? 추론 및 문제 해결 능력에서는 제미나이 3 프로가 압도적이다. 복잡한 인과관계를 파악해야 하는 과학, 공학 분야에서 독보적 성능을 보인다. 기존 AI가 확률에 의존해 그럴듯한 문장을 만들어내는 데 그쳤다면, 제미나이 3 프로는 논리적 단계를 거쳐 해답을 도출한다. 특히 긴 문맥을 이해하고 다수의 변수를 통제해야 하는 코딩 및 연구 보조 업무에서 GPT-5.1을 압도한다. 멀티모달 통합 능력도 제미나이의 강점이다. 구글은 설계 단계부터 텍스트, 이미지, 오디오, 비디오를 동시에 학습시킨 '네이티브 멀티모달' 아키텍처를 적용했다. 덕분에 영상을 보며 실시간으로 음성 대화를 나누는 자연스러움이 인간에 가깝다. 반면 GPT-5.1은 텍스트 기반 모델에 시각 기능을 결합한 형태로, 복합적인 데이터를 처리할 때 미세한 지연이나 문맥 손실이 발생하곤 한다.
하지만 창의성 및 대화의 유연성에서는 GPT-5.1이 여전히 우세하다. 소설 작성, 시 창작, 감성적인 대화에서는 여전히 GPT 특유의 자연스럽고 인간적인 뉘앙스가 강점이다. 제미나이 3 프로는 다소 '모범생' 같고 딱딱한 답변을 내놓는 경향이 있어, 문예 창작이나 일상적인 챗봇 용도로는 GPT-5.1의 선호도가 높다. 생태계 연동성에서는 제미나이가 파괴적 경쟁력을 보인다. 구글 워크스페이스(Docs, Gmail, Drive) 및 안드로이드 OS와의 결합은 압도적이다. 사용자의 이메일을 분석해 일정을 잡고, 문서를 요약해 보고서를 쓰는 과정이 하나의 유기체처럼 작동한다. GPT-5.1은 마이크로소프트와의 협업을 통해 코파일럿에 탑재되어 있으나, OS 레벨의 통합도 면에서는 구글의 안드로이드 생태계를 따라잡기 버거운 모양새다.
■ '다윗'은 왜 멈췄나... 데이터와 컴퓨팅의 벽
업계 전문가들은 이번 역전극의 배경으로 '인프라의 승리'를 꼽는다. 생성형 AI의 성능은 결국 학습 데이터의 양과 이를 처리할 컴퓨팅 파워에 비례한다. 구글은 자체 개발한 AI 반도체인 TPU(텐서 처리 장치) v6 팟 수만 개를 연결한 슈퍼컴퓨터를 통해 제미나이 3 프로를 학습시켰다. 유튜브의 방대한 영상 데이터와 구글 스칼라(학술 검색)의 고급 데이터가 학습의 질을 높였다. 반면 오픈AI는 엔비디아 GPU 수급난과 마이크로소프트의 클라우드 자원 할당 문제로 인해 모델 스케일업 속도 조절에 들어갈 수밖에 없었다는 후문이다. 스타트업의 기민함으로 초기 시장을 선점했으나, 거대 자본과 인프라가 필요한 '규모의 경제' 단계로 접어들자 구글의 저력이 빛을 발한 것이다.
■AGI를 향한 진짜 경쟁의 시작
제미나이 3 프로의 등장은 AI 시장이 '신기한 챗봇' 단계를 지나 '문제 해결 솔루션' 단계로 진입했음을 시사한다. 이제 시장의 관심은 누가 먼저 범용 인공지능(AGI)에 도달하느냐에 쏠려 있다. AI전문가는 "앞으로 1~2년은 구글이 주도하는 '추론형 AI'가 모든 산업의 표준이 될 것"이라고 전망했다. 물론 오픈AI의 반격도 만만치 않을 것이다. 샘 알트만 CEO는 최근 내부 회의에서 완전히 새로운 방식의 차기 모델 'GPT-6(가칭)' 개발을 독려한 것으로 알려졌다. 하지만 당분간 '왕관의 무게'는 구글이 견디게 될 것으로 보인다. 2년 전, 섣부른 시연으로 망신을 당했던 구글은 이제 없다. 완벽하게 준비된 '골리앗'이 전장에 돌아왔다. 단순히 쓰러진 거인이 일어선 것이 아니다. 더 강해진 골리앗이, 이번에는 돌팔매가 아닌 과학으로 무장하고 돌아온 것이다.
