오늘은 OpenAI의 새로운 모델 ‘o1’이 출시되고 사용해 볼 수 있도록 업데이트 되어, ‘o1’ 모델 소개 및 사용기 포스트를 작성해보고자 한다.
Continue reading[태그:] 강화학습
OpenAI의 새로운 도약: 복잡한 추론을 가능케 하는 대형 언어 모델 ‘o1’ 출시
오늘은 9월 12일에 발표된 OpenAI의 새로운 대형 언어 모델 ‘o1’에 대해 자세히 소개하고자 한다. ‘o1’은 강화 학습을 통해 복잡한 추론
Continue reading멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 이란? – 응용 분야
멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다수의 에이전트가 동시에 학습하고 상호작용하는 환경에서 최적의 행동을 학습하는 강화 학습 방법을 말한다.
Continue reading멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 이란? – 주요 도전 과제
멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다수의 에이전트가 동시에 학습하고 상호작용하는 환경에서 최적의 행동을 학습하는 강화 학습 방법을 말한다.
Continue reading멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 이란? – 알고리즘과 접근법
멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다수의 에이전트가 동시에 학습하고 상호작용하는 환경에서 최적의 행동을 학습하는 강화 학습 방법을 말한다.
Continue reading멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 이란? – 협력과 경쟁
멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다수의 에이전트가 동시에 학습하고 상호작용하는 환경에서 최적의 행동을 학습하는 강화 학습 방법을 말한다.
Continue reading멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL) 이란? – 기본 개념
멀티 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다수의 에이전트가 동시에 학습하고 상호작용하는 환경에서 최적의 행동을 학습하는 강화 학습 방법을 말한다.
Continue reading머신러닝(Machine Learning)의 여러가지 학습 방법
머신러닝은 데이터에서 패턴을 학습하여 예측이나 결정을 내리는 인공지능의 한 분야이다. 이러한 학습은 크게 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화
Continue reading