Google Cloud Platform의 Vertex AI 소개(구글 인공지능 서비스)

Posted by

인공지능(AI)과 머신 러닝(ML)은 현대 기술의 최전선에 서있으며, 비즈니스의 혁신과 경쟁력 향상에 필수적인 역할을 하고 있다.

데이터의 양이 폭발적으로 증가함에 따라, 더욱 정교하고 효율적인 머신 러닝 모델을 구축하고 배포하는 것이 중요해졌으며, 이러한 배경에서 Google Cloud Platform(GCP)의 Vertex AI는 인공지능 전문가들에게 강력한 도구를 제공하며, 머신 러닝 프로젝트의 전체를 아우르는 통합된 환경을 제공한다.

Vertex AI란?

Vertex AI는 Google Cloud Platform(GCP)이 제공하는 완벽하게 관리되는 머신 러닝 서비스로, 데이터 사이언티스트와 ML 엔지니어가 모델을 빠르게 구축, 배포 및 확장할 수 있도록 지원한다. Vertex AI는 다양한 ML 모델, 프리미엄 데이터 사이언스 서비스, 그리고 광범위한 ML 운영 도구를 하나의 플랫폼에 통합하여, 효율성을 극대화하고 머신 러닝 프로젝트의 복잡성을 줄여주는 서비스이다.

Vertex AI 및 머신러닝(ML) Workflow(Source: GCP Vertex AI )

주요 기능 및 서비스

생성형 AI 모델 및 도구

Vertex AI의 Generative AI Studio는 생성형 AI 모델의 프로토타입을 신속하게 제작하고 테스트할 수 있는 Google Cloud 콘솔 도구를 제공한다. Generative AI Studio를 사용하여 프롬프트 샘플로 모델을 테스트하고, 프롬프트를 설계 및 저장하고, 기반 모델을 조정하고, 음성과 텍스트 간에 변환할 수 있다.

생성형 AI 활용(Source: GCP Vertex AI)

Generative AI Studio에서 사용가능한 모델은 아래와같다.

Model nameDescriptionModel properties
텍스트용 PaLM 2
PaLM 2 for Text 
(text-bison)
자연어 지침을 따르도록 미세 조정되었으며 다음과 같은 다양한 언어 작업에 적합함
– 분류
– 감성분석
– 엔터티 추출
– 추출적 질문 답변
– 요약
– 다른 스타일로 텍스트다시 쓰기
– 광고 카피 생성
– 컨셉 구상
최대 입력 토큰: 8192
최대 출력 토큰: 1024
훈련 데이터: 최대 2023년 2월
텍스트 임베딩
Embeddings for text
(textembedding-gecko)
Model tuning not supported
텍스트 입력에 대한 모델 임베딩을 반환3072개의 입력 토큰
768차원 벡터 임베딩을 출력
텍스트 다국어 임베딩
Embeddings for text multilingual
(textembedding-gecko-multilingual)
Model tuning not supported
100개 이상의 언어를 지원하는 텍스트 입력에 대한 모델 임베딩을 반환하는 모델3072개의 입력 토큰
768차원 벡터 임베딩을 출력
채팅용 PaLM 2
PaLM 2 for Chat
(chat-bison)
다중 대화 사용 사례에 맞게 미세 조정된 모델최대 입력 토큰: 8192
최대 출력 토큰: 1024
훈련 데이터: 2023년 2월까지
최대 회전수: 2500
코드생성을 위한 Codey
Codey for Code Generation
(code-bison)
원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델최대 입력 토큰: 6144
최대 출력 토큰: 1024
코드 채팅용 Codey
Codey for Code Chat
(codechat-bison)
코드 관련 질문에 도움이 되는 챗봇 대화를 위해 미세 조정된 모델최대 입력 토큰: 6144
최대 출력 토큰: 1024
코드 완성을 위한 Codey
Codey for Code Completion
(code-gecko)
Model tuning not supported
작성된 코드의 컨텍스트를 기반으로 코드 완성을 제안하도록 미세 조정된 모델최대 입력 토큰: 2048
최대 출력 토큰: 64
이미지 생성을 위한 Imagen
Imagen for Image Generation
(imagegeneration)
이미지 생성을 지원
단 몇 초 만에 고품질의 시각적 자산을 생성
프로젝트별 분당 최대 요청: 100
생성된 최대 이미지: 8
최대 기본 이미지(편집/업스케일링): 10MB
생성된 이미지 해상도: 1024×1024픽셀
멀티모달을 위한 임베딩
Embeddings for multimodal
(multimodalembedding)
사용자가 제공한 입력을 기반으로 벡터를 생성프로젝트당 분당 최대 요청: 120
최대 텍스트 길이: 32 토큰
언어: 영어
최대 이미지 크기: 20MB
이미지 캡셔닝
Image captioning
(imagetext)
이미지 캡션을 지원하는 모델
이 모델은 지정한 언어를 기반으로 제공한 이미지에서 캡션을 생성
프로젝트당 분당 최대 요청: 500
언어: 영어, 프랑스어, 독일어, 이탈리아어, 스페인어
최대 이미지 크기: 10MB
최대 캡션 수: 3
시각적 질문과 답변
Visual Question Answering – VQA
(imagetext)
이미지 질의응답을 지원하는 모델프로젝트당 분당 최대 요청: 500
언어: 영어
최대 이미지 크기: 10MB
최대 답변 수: 3

개방형 및 통합형 AI Platform

데이터 사이언티스트가 ML 모델의 학습, 조정, 배포를 위한 Vertex AI Platform의 도구를 사용하여 과정을 더 빠르게 진행할 수 있다.
원하는 Colab Enterprise 또는 Workbench를 비롯한 Vertex AI 노트북은 기본적으로 BigQuery와 통합되어 모든 데이터 및 AI 워크로드에 대한 단일 노출 영역을 제공하며, Vertex AI Training 및 Prediction은 원하는 오픈소스 프레임워크와 최적화된 AI 인프라로 학습 시간을 단축하고 모델을 배포하는 데 도움을 준다.

예측 및 생성형 AI를 위한 MLOps

Vertex AI Platform은 데이터 사이언티스트와 ML 엔지니어가 ML 프로젝트를 자동화, 표준화, 관리할 수 있도록 특화된 MLOps 도구를 제공한다.
모듈식 도구는 팀 간 공동작업과 전체 개발 수명 주기 전반에서 모델을 개선하는 데 도움이 되며,  Vertex AI Evaluation을 통해 사용 사례에 가장 적합한 모델을 파악하고, Vertex AI Pipelines로 워크플로를 조정하며, 모델 레지스트리로 모든 모델을 관리하고, Feature Store를 통해 ML 특성을 제공, 공유, 재사용하며, 모델의 입력 편향과 드리프트를 모니터링할 수 있다.

Search 및 Conversation

Vertex AI Search 및 Conversation은 개발자가 엔터프라이즈급 생성형 AI 기반 검색 및 채팅 애플리케이션을 빌드하고 배포할 수 있는 가장 빠른 방법을 제공한다. Vertex AI Search 및 Conversation은 복잡성과 엔터프라이즈급 데이터 개인 정보 보호 및 제어를 추상화하는 간편한 조정 레이어를 사용하여 개발자가 앱을 빠르고 효율적이며 책임감 있게 빌드하고 배포할 수 있도록 지원한다. 

AI 솔루션

Vertex AI Platform를 기반으로 빌드된 Contact Center AI, Document AI, 자금 세탁 방지 AI, Discovery AI 및 기타 AI 솔루션은 특정 비즈니스 성과를 달성하기 위한 강력한 타겟팅된 기능을 제공한다. 기업에서 Google Cloud의 AI 솔루션에 직접 액세스, 배포, 사용하거나 우선순위가 높은 Google 파트너 중 한 곳의 지원을 받을 수 있다.

결론

Vertex AI는 데이터 사이언티스트와 ML 엔지니어가 머신 러닝 모델을 빠르게 구축하고 배포할 수 있도록 지원하는 강력한 플랫폼이다. 통합된 도구와 서비스를 통해 복잡성을 줄이고 프로젝트의 효율성을 높일 수 있으며, Vertex AI는 신 러닝의 미래를 향한 거대한 도약을 가능하게 하는 중추적인 역할을 하게 될 것이다.

Leave a Reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다