[ChatGPT] 챗GPT, API에서 활용하고 선택 가능 다양한 언어 모델

Posted by

이 글에서는 ChatGPT를 중심으로 그 안에 탑재된 다양한 언어 모델들과 그 특징에 대해 살펴보자.
GPT 모델은 활용방법에 따라 주로 2가지로 활용 가능하다. 그 첫 번째는 Chat으로 활용하는 방법이고, 두 번째는 API를 활용한 방법이다. Chat으로 활용할 때는 GPT-3.5와 GPT-4의 두가지 모델만 활용할 수 있으나, API로 활용할 때는 사용가능한 모델의 종류가 더욱 많아진다.

언어 모델의 발전: GPT 시리즈의 탄생

GPT는 대량의 텍스트 데이터를 기반으로 학습된 언어 모델이다. GPT-1, GPT-2, GPT-3, GPT-4의 버전이 있으며, 각 버전마다 모델의 크기와 학습 데이터 양이 증가하여 성능이 향상되었다.

현재(23년 9월 11일) 가장 최신 모델은 GPT-4이며, GPT-4 안에서도 API 활용시 사용 가능한 다양한 모델이 존재한다.


활용가능한 GPT Models

GPT-4 Models

GPT-4 모델은 현재 가장 우수한 성능을 가진 모델이며, GPT-3.5 모델 보다 훨씬 더 안정적이고, 창의적이며, 미묘한 지침을 처리할 수 있다.

모델설명최대 토큰훈련 데이터
gpt-4GPT-3.5 모델보다 더 능력 있으며, 더 복잡한 작업을 수행할 수 있고 채팅에 최적화되어 있다. 최신 모델 반영 후 2주 내로 업데이트 된다.8,192 토큰2021년 9월까지
gpt-4-06132023년 6월 13일의 gpt-4 스냅샷으로, 함수 호출 데이터가 있다. gpt-4와 달리 이 모델은 업데이트를 받지 않으며, 새 버전 출시 후 3개월 이내에 사용 중지된다.8,192 토큰2021년 9월까지
gpt-4-32k표준 gpt-4 모델과 동일한 능력을 가지지만 문맥 길이가 4배 더 크며, 최신 모델 반영 후 업데이트 된다.32,768 토큰2021년 9월까지
gpt-4-32k-06132023년 6월 13일의 gpt-4-32k 스냅샷이다. gpt-4-32k와 달리 이 모델은 업데이트를 받지 않으며, 새 버전 출시 후 3개월 이내에 사용 중지된다.32,768 토큰2021년 9월까지
gpt-4-0314 (레거시)2023년 3월 14일의 gpt-4 스냅샷으로, 함수 호출 데이터가 있다. gpt-4와 달리 이 모델은 업데이트를 받지 않으며, 2024년 6월 13일 이후에 사용 중지된다.8,192 토큰2021년 9월까지
gpt-4-32k-0314 (레거시)2023년 3월 14일의 gpt-4-32k 스냅샷이다. gpt-4-32k와 달리 이 모델은 업데이트를 받지 않으며, 2024년 6월 13일 이후에 사용 중지된다.32,768 토큰2021년 9월까지

GPT-3.5 Models

가장 많이 알려진 모델로, Chat으로 활용할 때에는 무료로 사용 가능하나 API로 사용할 때는 유료인 모델이다.

모델설명최대 토큰훈련 데이터
gpt-3.5-turboGPT-3.5의 가장 능력 있는 모델이며 chat에 최적화되어 text-davinci-003의 1/10 비용이 든다. 최신 모델 반영 후 2주 내로 업데이트된다.4,097 토큰2021년 9월까지
gpt-3.5-turbo-16k표준 gpt-3.5-turbo 모델과 동일한 능력을 가지지만 문맥이 4배 더 크다.16,385 토큰2021년 9월까지
gpt-3.5-turbo-06132023년 6월 13일의 gpt-3.5-turbo 스냅샷으로, 함수 호출 데이터가 있다. gpt-3.5-turbo와 달리 이 모델은 업데이트를 받지 않으며, 새 버전 출시 후 3개월 이내에 사용 중지된다.4,097 토큰2021년 9월까지
gpt-3.5-turbo-16k-06132023년 6월 13일의 gpt-3.5-turbo-16k 스냅샷이다. gpt-3.5-turbo-16k와 달리 이 모델은 업데이트를 받지 않으며, 새 버전 출시 후 3개월 이내에 사용 중지된다.16,385 토큰2021년 9월까지
gpt-3.5-turbo-0301 (레거시)2023년 3월 1일의 gpt-3.5-turbo 스냅샷이다. gpt-3.5-turbo와 달리 이 모델은 업데이트를 받지 않으며, 2024년 6월 13일 이후에 사용 중지된다.4,097 토큰2021년 9월까지
text-davinci-003 (레거시)curie, babbage, ada 모델보다 더 나은 품질, 더 긴 출력 및 지시사항을 일관되게 따르는 모든 언어 작업을 수행할 수 있다. 텍스트 삽입과 같은 추가 기능도 지원한다.4,097 토큰2021년 6월까지
text-davinci-002 (레거시)text-davinci-003와 유사한 능력을 가지지만 강화 학습 대신 감독 fine-tuning으로 훈련되어있다.4,097 토큰2021년 6월까지
code-davinci-002 (레거시)코드 완성 작업에 최적화되어있다.8,001 토큰2021년 6월까지

GPT Base Models

GPT 기본 모델은 자연어나 코드를 이해하고 생성할 수 있지만, Instruction(지시사항)을 따르도록 훈련되지 않았다. 일반적으로는 GPT-3.5 또는 GPT-4를 사용하는 것을 추천한다.

모델설명최대 토큰훈련 데이터
babbage-002GPT-3 ada 및 babbage 기본 모델의 대체품16,384 토큰2021년 9월까지
davinci-002GPT-3 curie 및 davinci 기본 모델의 대체품16,384 토큰2021년 9월까지

LLMs (Large Language Models)의 특징

  • 규모: LLMs는 수십억 개 이상의 파라미터를 가진 거대한 모델이다.
  • 다양성: LLMs는 다양한 언어와 문화, 지식을 포괄적으로 학습하였다.
  • 적응성: 사용자의 질문이나 요구에 따라 다양한 스타일로 응답할 수 있다.

ChatGPT의 활용 사례

  • 문서 자동 생성: 블로그 글, 시나리오, 소설 등 다양한 장르의 텍스트를 생성할 수 있다.
  • 질의응답 시스템: 웹사이트나 앱에서의 고객 지원 역할을 수행할 수 있다.
  • 언어 교육: 다양한 언어를 학습하는 데 도움을 준다.

이 외에도 다양한 Application을 생성할 수 있으며, 상상하는 것을 그대로 만들어 낼 수 있을 것이다.


미래의 ChatGPT: 어디로 갈 것인가?

LLMs의 발전과 함께 ChatGPT의 활용 가능성도 점점 더 커질 것이다. Gpt-5 버전이 공개된다면 지구상의 많은 지식을 내가 바로 활용 가능한 시대가 도래하지 않을까 생각해 본다.

Leave a Reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다