image 1 OpenAI API 비용 최적화 가이드(최신 ChatGPT-4.5모델 포함) AI Research, ChatGPT

OpenAI API 비용 최적화 가이드(최신 ChatGPT-4.5모델 포함)

Posted by

2월 27일, GPT-4.5 모델이 발표되었다. OpenAI API는 ChatGPT를 포함하여 다양한 AI 모델을 제공하며, 각 모델 사용 시 토큰 단위로 과금된다. 본 가이드에서는 텍스트 토큰, 오디오 토큰, 파인 튜닝, 이미지 생성, 임베딩(Embeddings) 등 다양한 요금 체계를 자세히 살펴보고, 모델 간의 비용을 비교·정리해보고자 한다.

사용하고자 하는 플랫폼 종류를 선택하여 살펴보자. 개발, 평가 단계부터 최신모델을 사용할 경우 비용 폭탄이 청구 될 수 있으니 유의해야 하며, 포스트 마지막에 개발등에 API 비용을 최적화하는 방법을 공유하도록 하겠다.

기존 ChatGPT 가격 정책을 보고 싶다면, 아래 포스트를 확인해 보자.


ChatGPT API 토큰 기반 과금

OpenAI API에서는 1,000,000(백만) 토큰당 일정 금액을 청구하며, 토큰은 입력, 출력, 그리고 캐시된 입력으로 나누어 과금될 수 있다. 또한 Batch API를 활용하면 묶음 요청에 따른 할인 가격이 적용되기도 한다.

주의: 모든 금액은 예시로서, 실제 사용량에 따라 최종 청구 비용은 달라질 수 있다.

점점 모델이 많아지니 요금 비교하는 테이블도 점점 길어지고 있다.
자주 사용하는 모델들은 바로 아래에서 확인할 수 있으며, 모든 모델은 마지막에 Appendix로 추가해 놓을테니 필요하신분들은 목차 링크로 바로 가서 확인해보자.


텍스트 토큰(Text tokens) 요금 비교

아래 표는 가장 최신의 주요 모델을 대상으로 한 텍스트 토큰 기준의 가격을 비교해 보았다.
표의 모든 금액은 1백만(1M) 토큰당 비용이며, 일부 모델은 캐시된 입력(Cached input)에 할인된 요금이 적용된다.

가격을 보면 알겠지만, 이제는 API 테스트할 때도 모델을 잘 입력하고 테스트 해야 한다.
gpt-3.5-turbo와 gpt-4.5-preview의 가격차는 무려 입력 기준으로는 150배, 출력은 100배 차이가 나기 때문이다.
출력 제한을 걸지않고 모델을 잘못입력하고 테스트했다간 잔고가 순식간에 날아갈 수 있다.

모델버전입력(Input)캐시된 입력(Cached Input)출력(Output)
gpt-4.5-previewgpt-4.5-preview-2025-02-27$75.00$37.50$150.00
gpt-4ogpt-4o-2024-08-06$2.50$1.25$10.00
gpt-4o-audio-previewgpt-4o-audio-preview-2024-12-17$2.50$10.00
gpt-4o-minigpt-4o-mini-2024-07-18$0.15$0.075$0.60
gpt-4o-mini-audio-previewgpt-4o-mini-audio-preview-2024-12-17$0.15$0.60
o1o1-2024-12-17$15.00$7.50$60.00
o3-minio3-mini-2025-01-31$1.10$0.55$4.40
o1-minio1-mini-2024-09-12$1.10$0.55$4.40
gpt-4-turbogpt-4-turbo-2024-04-09$10.00$30.00
gpt-3.5-turbogpt-3.5-turbo-0125$0.50$1.50
davinci-002davinci-002$2.00$2.00
babbage-002babbage-002$0.40$0.40

Tip: GPT-4.5-preview는 고급 모델인 만큼 입력/출력 비용이 높지만, 높은 품질의 결과를 제공한다. gpt-4o-mini, gpt-3.5-turbo 등은 비용 면에서 더 경제적이며, 일반적인 대화형 응용이나 프로토타이핑에 적합하다.


오디오 토큰(Audio tokens) 요금 비교

오디오 모델은 음성 데이터를 입력 및 출력으로 처리하는 모델이다.

모델버전입력(Input)캐시된 입력출력(Output)
gpt-4o-audio-previewgpt-4o-audio-preview-2024-12-17$40.00$80.00
gpt-4o-mini-audio-previewgpt-4o-mini-audio-preview-2024-12-17$10.00$20.00
gpt-4o-realtime-previewgpt-4o-realtime-preview-2024-12-17$40.00$2.50$80.00
gpt-4o-mini-realtime-previewgpt-4o-mini-realtime-preview-2024-12-17$10.00$0.30$20.00

오디오 모델 요금이 텍스트 모델에 비해 높게 책정되어 있으므로, 실시간 음성 서비스나 음성 기반 애플리케이션을 개발할 때는 토큰 사용량을 최소화할 수 있는 전략이 중요하다.


파인 튜닝(Fine tuning) 요금

파인 튜닝은 모델을 특정 업무나 도메인에 맞춰 재학습시키는 과정을 말한다. 학습 데이터(Training), 입력(Input), 출력(Output)에 대한 토큰 비용이 각각 책정되며, Batch API는 입력(Input)과 출력(Output)에 한정하여 사용할 수 있고 Batch API를 사용할 경우 50% 할인 혜택을 볼 수 있다.

일반 요금

모델학습(Training)입력(Input)캐시된 입력출력(Output)
gpt-4o-2024-08-06$25.00$3.75$1.875$15.00
gpt-4o-mini-2024-07-18$3.00$0.30$0.15$1.20
gpt-3.5-turbo$8.00$3.00$6.00
davinci-002$6.00$12.00$12.00
babbage-002$0.40$1.60$1.60

Batch API 요금

모델학습(Training)입력(Input)캐시된 입력출력(Output)
gpt-4o-2024-08-06$1.875$7.50
gpt-4o-mini-2024-07-18$0.15$0.60
gpt-3.5-turbo$1.50$3.00
davinci-002$6.00$6.00
babbage-002$0.80$0.80

주의: 파인 튜닝 시에는 학습용 데이터 토큰 비용이 별도로 청구된다. 대규모 데이터로 학습할 경우 비용이 크게 증가할 수 있으므로, 데이터 양을 신중하게 계획해야 한다.


Assistants API

Assistants API는 선택한 모델의 토큰 단가에 따라 그대로 비용이 부과된다. 별도의 고정 비용이 없으며, 사용량에 따른 토큰 비용만 청구된다.

또한, Code Interpreter나 File Search 같은 추가 기능을 이용할 때는 별도의 과금 구조가 존재할 수 있다.

Tool비용
Code Interpreter$0.03 / session
File Search$0.10 / GB/day (1GB 무료)

음성 인식 및 음성 생성

OpenAI API에서는 음성 인식음성 생성 모델을 별도로 제공하며, 다음과 같은 요금 체계를 가진다.

모델사용 사례비용
Whisper음성 인식(Transcription)$0.006 / 분 (minute)
TTS일반 음성 생성$15.00 / 1M characters
TTS HD고품질 음성 생성$30.00 / 1M characters

음성 데이터를 대량으로 처리해야 하는 경우, 사용량 예측과 비용 계산이 사전에 필수적이다.


이미지 생성 (DALL·E)

DALL·E 3와 DALL·E 2 모델은 해상도별로 이미지 한 장당 요금이 책정된다.

DALL·E 3

품질1024×10241024×1792
Standard$0.04$0.08
HD$0.08$0.12

DALL·E 2

해상도비용
256×256$0.016
512×512$0.018
1024×1024$0.02

고해상도 이미지를 많이 생성할수록 비용이 증가하므로, 필요한 해상도에 맞춰 이미지를 요청하는 것이 중요하다.


임베딩(Embeddings)

텍스트를 벡터 형태로 변환하여 검색, 추천 시스템 등에 활용하는 임베딩 모델은 다음과 같은 비용 구조를 가진다.

모델비용(1M tokens)
text-embedding-3-small$0.02
text-embedding-3-large$0.13
text-embedding-ada-002$0.10

임베딩은 대규모 텍스트 데이터를 처리할 때 토큰 사용량이 클 수 있으므로, 쿼리 전략과 데이터 전처리를 적절히 설계해야 한다.


Moderation

미디어와 텍스트가 정책을 준수하는지 검사하는 Moderation 모델은 현재 무상(Free)으로 제공되고 있다.

모델비용
omni-moderation-latestFree
text-moderation-latestFree

AI 기술을 활용할 때 윤리적, 정책적 문제를 사전에 파악하기 위해 Moderation 모델의 사용이 권장된다.


비용 절약을 위한 활용 팁

  1. 적절한 모델 선택
    • 고가 모델인 GPT-4.5-preview나 GPT-4o 시리즈보다, gpt-4o-mini나 gpt-3.5-turbo 등을 사용하면 비용을 크게 낮출 수 있다.
    • 멀티모달 입력이 필요하지 않다면, 이미지·음성 지원 모델 대신 텍스트 전용 모델을 선택하자.
  2. Batch API 적극 활용
    • 즉답이 필요한 경우가 아닐 때, 여러 요청을 묶어서 전송하면, 단일 요청 대비 비용 절감을 기대할 수 있다.
    • 대규모 데이터를 한 번에 처리할 때 유용하다.
  3. 캐시된 입력(Cached Input) 재활용
    • 자주 사용하는 Prompt(프롬프트)나 공통 데이터가 있다면 캐시를 활성화해, 할인된 입력 요금을 적용받을 수 있다.
  4. 최소 단위로 요청하기
    • 한 번에 너무 많은 텍스트를 전송하기보다, 필요한 정보 단위로 분할해서 요청하면 오히려 총 토큰 사용량이 줄어들 수 있다.
    • 특히 대화형 애플리케이션에서 세분화된 메시지 구조를 채택해 불필요한 맥락 전송을 줄여 사용하자.
  5. Preprocessing & Postprocessing
    • 전처리를 통해 중복된 텍스트나 사용하지 않을 데이터를 사전에 제거하자.
    • 모델 출력(후처리)도 텍스트 길이를 줄이는 규칙을 두면 불필요한 토큰 사용이 감소한다.
  6. Fine-tuning 전략
    • 파인 튜닝은 강력한 기능이지만, 데이터 양이 많으면 비용이 급증할 수 있다.
    • 필요한 도메인 데이터만 선별해서 최소 규모로 학습하는 것이 효율적이다.
  7. 모니터링 도구 사용
    • OpenAI 대시보드나 API 로깅 기능을 활용해 토큰 사용량을 정기적으로 모니터링해야 한다.
    • 예상 범위를 벗어나면 즉시 알림을 받도록 설정해 예산 초과를 방지할 수 있다.
  8. 테스트 환경과 운영 환경 분리
    • 개발/테스트 시에는 더 저렴한 모델을 사용하거여 비용 낭비를 방지하면서 개발한 뒤 고급모델을 활용하자.
    • 운영 환경에서는 안정성과 정확도가 중요한 만큼, 더 고성능 모델을 사용하는 것이 좋다.

OpenAI API 비용 구조는 모델 및 사용 방식에 따라 크게 달라진다. 필요 기능예산을 고려하여 적절한 모델을 고르고, Batch API, 캐시 활용, 전처리 등 다양한 방법으로 비용을 절감할 수 있다. 음성·이미지 같은 멀티모달 기능을 사용할 때는 토큰 사용량이 증가하므로, 사전 모니터링과 계획이 필수적이다.


Appendix

텍스트 토큰(Text tokens) 전체 요금 비교

아래 표는 모든 모델을 대상으로 한 텍스트 토큰 기준의 가격이다.(가격 / 1M tokken)

모델버전입력(Input)캐시된 입력(Cached Input)출력(Output)
gpt-4.5-previewgpt-4.5-preview-2025-02-27$75.00$37.50$150.00
gpt-4.5-preview-2025-02-27(동일)$75.00$37.50$150.00
gpt-4ogpt-4o-2024-08-06$2.50$1.25$10.00
gpt-4o-2024-11-20$2.50$1.25$10.00
gpt-4o-2024-08-06$2.50$1.25$10.00
gpt-4o-2024-05-13$5.00$15.00
gpt-4o-audio-previewgpt-4o-audio-preview-2024-12-17$2.50$10.00
gpt-4o-audio-preview-2024-12-17(동일)$2.50$10.00
gpt-4o-audio-preview-2024-10-01$2.50$10.00
gpt-4o-realtime-previewgpt-4o-realtime-preview-2024-12-17$5.00$2.50$20.00
gpt-4o-realtime-preview-2024-12-17(동일)$5.00$2.50$20.00
gpt-4o-realtime-preview-2024-10-01$5.00$2.50$20.00
gpt-4o-minigpt-4o-mini-2024-07-18$0.15$0.075$0.60
gpt-4o-mini-2024-07-18(동일)$0.15$0.075$0.60
gpt-4o-mini-audio-previewgpt-4o-mini-audio-preview-2024-12-17$0.15$0.60
gpt-4o-mini-audio-preview-2024-12-17(동일)$0.15$0.60
gpt-4o-mini-realtime-previewgpt-4o-mini-realtime-preview-2024-12-17$0.60$0.30$2.40
gpt-4o-mini-realtime-preview-2024-12-17(동일)$0.60$0.30$2.40
o1o1-2024-12-17$15.00$7.50$60.00
o1-2024-12-17(동일)$15.00$7.50$60.00
o1-preview-2024-09-12(동일)$15.00$7.50$60.00
o3-minio3-mini-2025-01-31$1.10$0.55$4.40
o3-mini-2025-01-31(동일)$1.10$0.55$4.40
o1-minio1-mini-2024-09-12$1.10$0.55$4.40
o1-mini-2024-09-12(동일)$1.10$0.55$4.40
chatgpt-4o-latest(동일)$5.00$15.00
gpt-4-turbogpt-4-turbo-2024-04-09$10.00$30.00
gpt-4-turbo-2024-04-09(동일)$10.00$30.00
gpt-4-0125-preview(동일)$10.00$30.00
gpt-4-1106-preview(동일)$10.00$30.00
gpt-4-1106-vision-preview(동일)$10.00$30.00
gpt-4-0613(동일)$30.00$60.00
gpt-4-0314(동일)$30.00$60.00
gpt-4-32k(동일)$60.00$120.00
gpt-3.5-turbogpt-3.5-turbo-0125$0.50$1.50
gpt-3.5-turbo-0125(동일)$0.50$1.50
gpt-3.5-turbo-1106(동일)$1.00$2.00
gpt-3.5-turbo-0613(동일)$1.50$2.00
gpt-3.5-0301(동일)$1.50$2.00
gpt-3.5-turbo-instruct(동일)$1.50$2.00
gpt-3.5-turbo-16k-0613(동일)$3.00$4.00
davinci-002(동일)$2.00$2.00
babbage-002(동일)$0.40$0.40

오디오 토큰(Audio tokens) 전체 요금 비교

모델버전입력(Input)캐시된 입력출력(Output)
gpt-4o-audio-previewgpt-4o-audio-preview-2024-12-17$40.00$80.00
gpt-4o-audio-preview-2024-12-17(동일)$40.00$80.00
gpt-4o-audio-preview-2024-10-01(동일)$100.00$200.00
gpt-4o-mini-audio-previewgpt-4o-mini-audio-preview-2024-12-17$10.00$20.00
gpt-4o-mini-audio-preview-2024-12-17(동일)$10.00$20.00
gpt-4o-realtime-previewgpt-4o-realtime-preview-2024-12-17$40.00$2.50$80.00
gpt-4o-realtime-preview-2024-12-17(동일)$40.00$2.50$80.00
gpt-4o-realtime-preview-2024-10-01(동일)$100.00$20.00$200.00
gpt-4o-mini-realtime-previewgpt-4o-mini-realtime-preview-2024-12-17$10.00$0.30$20.00
gpt-4o-mini-realtime-preview-2024-12-17(동일)$10.00$0.30$20.00

Leave a Reply

Your email address will not be published. Required fields are marked *