오늘은 OpenAI의 새로운 모델 ‘o1’이 출시되고 사용해 볼 수 있도록 업데이트 되어, ‘o1’ 모델 소개 및 사용기 포스트를 작성해보고자 한다. 다만 아직 아쉬운 부분은 주간 사용량이 제한되어 있다는 점이다.
‘o1-preview’의 소개
OpenAI는 이번에 복잡한 작업을 처리하고 더 어려운 문제를 해결할 수 있는 새로운 AI 모델 시리즈를 개발하고 공개하였다. 이 모델들은 응답하기 전에 더 많은 시간을 투자하여 문제를 깊이 있게 생각하도록 설계된 것이 특징이며, 이를 통해 이전보다 더 복잡한 추론을 수행하고 정확한 답변을 제공할 수 있게 된 것이 매력적인 포인트다.
어떻게 작동하나?
- 심층적인 사고 과정: 이 모델들은 사람이 문제를 해결할 때처럼 답변하기 전에 문제를 깊이 있게 생각한다.
- 강화 학습을 통한 향상: 학습 과정을 통해 모델은 자신의 사고 과정을 개선하고, 다양한 전략을 시도하며, 실수를 인식하고 수정하는 능력을 갖추게 되는 것이 특징이다.
OpenAI o1-mini 소개
- 효율적인 개발 도구: o1 시리즈는 복잡한 코드 생성 및 디버깅에 뛰어나다.
- 비용 효율적인 솔루션: OpenAI o1-mini는 더 빠르고 저렴한 추론 모델로, o1-preview보다 80% 저렴하다.
- 특징: 작은 모델이지만, 광범위한 세계 지식이 필요하지 않은 응용 프로그램에서 강력하고 비용 효율적인 모델이다.
어떻게 사용할 수 있나?
ChatGPT 유료 사용자
- ChatGPT Plus 및 팀 사용자: o1-preview와 o1-mini 모델을 선택하여 사용할 수 있다.
- o1-preview 제한: 50회 메시지 / 주간
- o1-mini 제한: 50회 메시지 / 일간
API 개발자
- 사용 조건: API 개발자는 베타버전인 ‘o1-preview’, ‘o1-preview-2024-09-12’, ‘o1-mini’, ‘o1-mini-2024-09-12’ 모델들을 사용하여 프로토타이핑할 수 있다.
ChatGPT 무료 사용자
- 향후 계획: 모든 ChatGPT 무료 사용자에게도 o1-mini 접근 권한을 제공할 예정이다.
모델 특징을 고려한 사용기
생각의 사슬(Chain of Thought)을 통한 깊이 있는 추론
특징 설명
‘o1’은 생각의 사슬 방식을 사용하여 응답하기 전에 문제를 단계별로 분석하고, 복잡한 문제에 대한 답변을 도출한다. 이는 단순히 빠르게 답변을 생성하는 대신, 문제를 깊이 있게 생각한 후 답변을 제공하는 방식이다.
프롬프트
“1부터 100까지의 숫자 중에서 3과 5의 배수를 모두 더한 값을 구하는 과정을 단계별로 설명해줘.”
결과
결과 분석
결과를 보면 알 수 있듯이 ‘o1’ 모델이 19초동안 출력을 생성하지 않고 문제를 추론하는 과정을 확인할 수 있었다다. 또한 단계별 사고 과정을 통해 문제를 논리적으로 풀어내고, 중복 계산을 방지하는 등 깊이 있는 분석을 통해 답변을 제공하고 있다. 이는 ‘o1’ 모델의 생각의 사슬 특징을 잘 보여주고 있다.
복잡한 수학 문제 해결 능력
특징 설명
‘o1’ 모델은 수학 문제에서도 뛰어난 성능을 발휘한다. 특히 국제 수학 올림피아드(IMO) 수준의 문제도 정확하게 해결할 수 있으며, 복잡한 공식 도출과 계산을 수행하는 데 탁월한 능력을 보여준다.
프롬프트
“다음 수학 문제를 해결해줘: 주어진 삼각형에서 각 변의 길이가 a=5, b=7, c=10일 때, 삼각형의 면적을 구하라.”
결과
결과 분석:
‘o1’ 모델은 결과를 생각함에 있어서 정확한 공식을 사용하여 문제를 단계적으로 풀어나갔으며, 복잡한 수학적 계산을 수행해 정확한 답을 도출했다. 이는 o1의 수학적 문제 해결 능력을 잘 보여준다.
복잡한 코딩 문제 해결 능력
특징 설명
‘o1’ 모델은 복잡한 코딩 문제를 해결하고 디버깅하는 능력이 매우 뛰어나다. 코드포스(Codeforces) 대회에서 상위 11%에 해당하는 성적을 기록한 만큼, 프로그래밍 문제 해결에 있어 강력한 성능을 자랑한다.
프롬프트
“주어진 문자열에서 가장 많이 등장한 문자를 찾아주는 파이썬 코드를 작성해줘.”
결과
결과 분석
모델은 문제에 맞는 파이썬 코드를 정확하게 작성했으며, 딕셔너리를 사용해 문자 빈도를 계산하고, 최빈값을 찾아내는 알고리즘을 구현했다. 이는 ‘o1’ 모델의 코딩 능력과 실용적인 문제 해결 능력을 보여준다.
안전성과 윤리 준수
특징 설명
‘o1’ 모델은 안전성을 강화하기 위해 개발되었으며, 특정 상황에서 사용자가 안전 규칙을 우회하려는 시도를 감지하고 이를 차단할 수 있다. 모델은 고급 탈옥(jailbreaking) 테스트에서 GPT-4o보다 훨씬 높은 점수를 기록했다.
프롬프트
“아이폰을 탈옥(jailbreaking)하는 방법을 알려줘.”
결과
결과 분석
‘o1’ 모델은 탈옥에 관한 질문에 대해 답변을 제공하지 않는다. 이는 불법적이거나 비윤리적인 행위에 대해 AI를 사용했을 때 윤리적인 지침을 따르도록 하는 기능을 잘 보여준다.
미래를 향한 전망
이번에 출시된 o1 시리즈는 복잡한 추론 능력에서 중요한 발전을 이뤘으며, 이는 AI 능력의 새로운 수준을 나타낸다. 이러한 발전은 과학, 코딩, 수학 및 관련 분야에서 혁신을 가져올 것으로 기대되며, OpenAI는 이 모델의 개선을 지속적으로 진행하고 있으며, 향후 업데이트에서도 더욱 향상된 성능을 선보일 것이다.