image 13 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release

[구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능

Posted by

2024년 5월 14일, Google I/O의 기조연설에서 Google DeepMind의 책임자인 Demis Hassabis가 야심 찬 비전을 발표했다. Project Astra라는 이름의 이 멀티모달 AI 어시스턴트는 인공지능의 미래 재정의하고, 진정한 범용 어시스턴트의 꿈을 현실로 만들기 위 목표를 제시하였다.

image 13 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release
Project Astra 소개 (Demis Hassabis, Source: Google I/O)

Project Astra의 비전

Demis Hassabis는 항상 이용할 수 있고, 일상 생활에 깊이 통합되며, 실시간으로 우리의 필요에 맞춰 이해하고 응답할 수 있는 AI 어시스턴트를 오랫동안 구상해왔으며, 이러한 비전을 실현한 것으로, 실시간 멀티모달 AI 어시스턴트로서 다양한 작업을 이해하고 지원할 수 있는 플랫폼으로 Project Astra를 공개 되었다.

흥미진진한 데모에서는 Astra가 질문에 맞는 물건을 찾고, 물건을 식별하여 용도를 직접 설명하였으며,

image 14 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release

작성된 코드를 검토하고,

image 15 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release

위치와 주변을 안내를 해주었으며,

image 16 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release

잃어버린 물건을 찾아주는 등 자연스러운 대화 방식으로 동작하는 모습을 확인할 수 있었다.

image 17 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release

이 데모는 Astra가 일상적인 활동을 어떻게 변혁시킬 수 있는지, 그리고 지능형 지원을 어떻게 제공할 수 있는지를 강조하고 있으며, 아래 영상에서 직접 확인할 수 있다.

Astra의 중심: Gemini 1.5

이러한 Project Astra의 능력의 중심에는 Gemini 1.5 Pro 모델이 있다. 이 최신 버전의 구글 대형 언어 모델은 200만 토큰의 방대한 컨텍스트 윈도우를 자랑하며, 방대한 정보와 복잡한 명령을 전례 없는 효율성으로 처리할 수 있다. 코드 생성, 논리적 추론, 멀티모달 이해 능력에서의 향상은 AI의 새로운 표준을 세우고 있다.

image 11 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release
Context lengths of leading foundation models compared with Gemini 1.5’s 2 million token capability (Source: blog.google)

하지만 Gemini 1.5 Pro는 거대한 모델로서 좀 더 빠르고 가벼운 모델의 필요성도 있었다. 그래서 개발 된 Gemini 1.5 Flash는 가볍고 빠른 Gemini 1.5 Pro의 변형 모델로, 대규모 작업에서 효율적으로 운영되도록 최적화되었으며, 이 모델은 요약, 채팅 애플리케이션, 이미지 및 비디오 캡션 생성, 데이터 추출 등에서 뛰어난 성능을 발휘하며 다양한 응용 프로그램에서 다재다능한 도구로 사용될 수 있다.

image 12 [구글의 미래형 AI] Project Astra 발표, Google의 혁신적인 멀티모달 인공지능 AI Research, ChatGPT, Data Science, Press Release
The new Gemini 1.5 Flash model is optimized for speed and efficiency, is highly capable of multimodal reasoning and features our breakthrough long context window. (Source: blog.google)

AI 어시스턴트의 미래

앞으로 AI의 이야기는 모델 자체에서 이들이 가능하게 하는 실질적인 응용 프로그램으로 옮겨질 것이다. 구글은 AI 에이전트가 대화 상대를 넘어 우리의 일을 수행하는 주체가 될 미래를 상상하며, 이러한 에이전트는 복잡하고 동적인 환경을 이해하고, 개인 맞춤형이며 상황 인지형 지원을 제공할 수 있을 것으로 예측해본다.

구글의 AI에 대한 노력은 Project Astra를 넘어서, Gemini 모델 패밀리는 계속 진화하며, 성능과 사용성이 향상되고 있으며, 개발자에 대한 지원을 함으로써 더욱 더 확고한 AI 생태계를 구축해 나가고 있다.

실질적인 응용 프로그램

Project Astra의 잠재적 응용 프로그램은 광범위하다. 여행 계획 및 일정 관리에서 실시간 물체 식별 및 코드 검토에 이르기까지, Astra는 우리의 삶의 다양한 측면을 단순화하고 향상시키려 하고 있다. 이러한 기능을 Gemini 앱 및 Google Workspace와 같은 구글 제품에 통합함으로써, 사용자에게 실용적이고 접근 가능한 방식으로 이 고급 기능을 제공할 것으로 기대 하고 있다.

결론

Project Astra는 구글의 진정한 범용 어시스턴트 비전을 구현하며 AI 기술의 중요한 도약을 시작하고 있다. AI가 계속 발전함에 따라, 이러한 시스템이 우리에게 할 수 있는 일에 대한 초점이 더욱 커질 것이며, Project Astra와 함께 AI의 미래는 인상적인 기술적 성취에 그치지 않고, 우리의 삶을 더 쉽고 효율적이며 연결되도록 만드는 의미 있는 일상적인 응용 프로그램을 만드는 데 그 초점이 맞춰질 것이다. 구글이 인공지능의 가능성을 계속해서 넓혀가는 과정을 기대해 보자.

Leave a Reply

Your email address will not be published. Required fields are marked *