Retrieval-Augmented Generation(RAG) 모델은 정보 검색과 텍스트 생성을 결합한 혁신적인 AI 기술이다. 이번 포스트에서는 Python을 사용하여 간단한 RAG 모델을 구현하고, 그
Continue reading[태그:] Deep Learning
[Perception] 컴퓨터 비전, 이미지 인식에 사용되는 주요 머신러닝 알고리즘
컴퓨터 비전, 이미지 인식은 컴퓨터가 이미지나 영상에서 패턴을 인식하게 하는 기술로, 의료, 자율주행, 보안 등 다양한 분야에서 활용되고 있다. 이번
Continue reading데이터 보강(Data Augmentation), 트레이닝 데이터가 부족할 때
데이터 보강(Data Augmentation) 이란? 기존 데이터 세트를 변형하여 새로운 데이터를 생성하는 기술로 실질적인 데이터 세트의 규모를 키울 수 있는 방법이다.이를
Continue reading여러 종류의 데이터를 기반으로 학습 하기(Mixed Data Learning)
Mixed Data Learning은 다양한 유형의 데이터를 사용하여 학습하는 기술이다. 이러한 데이터는 텍스트, 이미지, 오디오, 비디오 등 여러 형식일 수 있다.
Continue reading머신러닝 데이터세트 분할 방법(How to split your dataset?, train_test_split, KFold, StratifiedKFold)
데이터세트 분할은 머신 러닝 모델을 학습시키기 위한 중요한 단계 중 하나이다. 머신러닝 모델 학습에 있어서 데이터세트를 학습용(train), 검증용(validation), 테스트용(test)으로 나누는
Continue readingMS Bing 검색엔진과 AI챗봇, ChatGPT의 결합 그리고 Google의 AI챗봇 LaMDA
2023년 1월 3일, 언론매체 The Information은 마이크로소프트가 Bing 검색엔진에 OpenAI의 ChatGPT 기술을 적용할 것이라 보도했다. ChatGPT는 대화수준이 실제 인간의 것도
Continue readingDataset Split(데이터세트 분리하기) – Training, Validation, Test
모델을 구축하거나 모형을 학습하고 평가 하기 위해서 Dataset이 필요하다.이때 Dataset은 성질에 맞게 3가지로 분류하여 사용한다. Dataset이 충분히 커서 Train을 위해
Continue reading통계의 함정 – 심슨의 역설(Pitfalls of Statistics – Simpson’s Paradox)
불확실성과 우연 현상을 다루는 확률은 논리적이고 결정론 적이며 인과 관계가 뚜렷한 다른 수학 주제와 확연히 구별되는 특성을 지닌다. 그런 연유에서
Continue reading인공지능 기술(Artificial Intelligence Technology)
인공지능 기술은 단일하게 구성된 기술이 아니라, 복합적이고 통합적인 기술 포트폴리오다.인공지능 기술은 크게 4가지로 나눠 볼 수 있다.
Continue readingFederated Learning(Collaborative Learning, 연합학습)
연합학습(Federated Learning)이란? 연합학습(협력학습)은 로컬 데이터 샘플을 보유하고 있는 여러 분산형 장치, 서버에 걸쳐 알고리즘을 교환하지 않고 훈련하는 머신러닝 학습 방법이다.
Continue reading