2024년 5월 14일, Google I/O의 기조연설에서 Google DeepMind의 책임자인 Demis Hassabis가 야심 찬 비전을 발표했다. Project Astra라는 이름의 이 멀티모달 AI 어시스턴트는 인공지능의 미래 재정의하고, 진정한 범용 어시스턴트의 꿈을 현실로 만들기 위 목표를 제시하였다.
Project Astra의 비전
Demis Hassabis는 항상 이용할 수 있고, 일상 생활에 깊이 통합되며, 실시간으로 우리의 필요에 맞춰 이해하고 응답할 수 있는 AI 어시스턴트를 오랫동안 구상해왔으며, 이러한 비전을 실현한 것으로, 실시간 멀티모달 AI 어시스턴트로서 다양한 작업을 이해하고 지원할 수 있는 플랫폼으로 Project Astra를 공개 되었다.
흥미진진한 데모에서는 Astra가 질문에 맞는 물건을 찾고, 물건을 식별하여 용도를 직접 설명하였으며,
작성된 코드를 검토하고,
위치와 주변을 안내를 해주었으며,
잃어버린 물건을 찾아주는 등 자연스러운 대화 방식으로 동작하는 모습을 확인할 수 있었다.
이 데모는 Astra가 일상적인 활동을 어떻게 변혁시킬 수 있는지, 그리고 지능형 지원을 어떻게 제공할 수 있는지를 강조하고 있으며, 아래 영상에서 직접 확인할 수 있다.
Astra의 중심: Gemini 1.5
이러한 Project Astra의 능력의 중심에는 Gemini 1.5 Pro 모델이 있다. 이 최신 버전의 구글 대형 언어 모델은 200만 토큰의 방대한 컨텍스트 윈도우를 자랑하며, 방대한 정보와 복잡한 명령을 전례 없는 효율성으로 처리할 수 있다. 코드 생성, 논리적 추론, 멀티모달 이해 능력에서의 향상은 AI의 새로운 표준을 세우고 있다.
하지만 Gemini 1.5 Pro는 거대한 모델로서 좀 더 빠르고 가벼운 모델의 필요성도 있었다. 그래서 개발 된 Gemini 1.5 Flash는 가볍고 빠른 Gemini 1.5 Pro의 변형 모델로, 대규모 작업에서 효율적으로 운영되도록 최적화되었으며, 이 모델은 요약, 채팅 애플리케이션, 이미지 및 비디오 캡션 생성, 데이터 추출 등에서 뛰어난 성능을 발휘하며 다양한 응용 프로그램에서 다재다능한 도구로 사용될 수 있다.
AI 어시스턴트의 미래
앞으로 AI의 이야기는 모델 자체에서 이들이 가능하게 하는 실질적인 응용 프로그램으로 옮겨질 것이다. 구글은 AI 에이전트가 대화 상대를 넘어 우리의 일을 수행하는 주체가 될 미래를 상상하며, 이러한 에이전트는 복잡하고 동적인 환경을 이해하고, 개인 맞춤형이며 상황 인지형 지원을 제공할 수 있을 것으로 예측해본다.
구글의 AI에 대한 노력은 Project Astra를 넘어서, Gemini 모델 패밀리는 계속 진화하며, 성능과 사용성이 향상되고 있으며, 개발자에 대한 지원을 함으로써 더욱 더 확고한 AI 생태계를 구축해 나가고 있다.
실질적인 응용 프로그램
Project Astra의 잠재적 응용 프로그램은 광범위하다. 여행 계획 및 일정 관리에서 실시간 물체 식별 및 코드 검토에 이르기까지, Astra는 우리의 삶의 다양한 측면을 단순화하고 향상시키려 하고 있다. 이러한 기능을 Gemini 앱 및 Google Workspace와 같은 구글 제품에 통합함으로써, 사용자에게 실용적이고 접근 가능한 방식으로 이 고급 기능을 제공할 것으로 기대 하고 있다.
결론
Project Astra는 구글의 진정한 범용 어시스턴트 비전을 구현하며 AI 기술의 중요한 도약을 시작하고 있다. AI가 계속 발전함에 따라, 이러한 시스템이 우리에게 할 수 있는 일에 대한 초점이 더욱 커질 것이며, Project Astra와 함께 AI의 미래는 인상적인 기술적 성취에 그치지 않고, 우리의 삶을 더 쉽고 효율적이며 연결되도록 만드는 의미 있는 일상적인 응용 프로그램을 만드는 데 그 초점이 맞춰질 것이다. 구글이 인공지능의 가능성을 계속해서 넓혀가는 과정을 기대해 보자.