DataScience - DEEPLINK CORE Lab

04/18/2025 데이터사이언스 / 머신러닝

베이즈 정리 완전 이해: 기본부터 머신러닝 활용까지 한 번에 정리!

데이터 사이언스와 인공지능(AI)을 공부하면서 절대 빠질 수 없는 개념 중 하나가 바로 베이즈 정리(Bayes’ Theorem)이다. 이 베이즈 정리는 새로운 사건이

04/07/2025 Python 실습 / 데이터사이언스

중심 극한 정리 완벽 정리: 개념, 수식, 예시, 데이터 분석 적용까지

중심 극한 정리(Central Limit Theorem, CLT)는 통계학과 데이터 사이언스에서 매우 중요한 핵심 이론이다.“모집단의 분포가 무엇이든 간에, 표본의 평균은 정규 분포를

04/07/2025 Python 실습 / 데이터사이언스

데이터 정규화란? 다양한 정규화 방법 완전 정리 (샘플 코드 포함)

데이터 정규화(Data Normalization)는 머신러닝 모델을 개발할 때 거의 필수적으로 사용되는 전처리 작업이다. 데이터의 크기(스케일)가 서로 다르면, 일부 변수의 영향력이 과도하게

04/06/2025 Python 실습 / 데이터사이언스

결측치 처리 방법 완벽 정리: 유형별 대처 전략과 실무 적용법

‘결측치(Missing Data)‘란 데이터 세트에서 관찰되지 않거나 기록되지 않은 값들을 의미한다. 다양한 이유로 데이터 수집 과정에서 일부 정보가 누락되거나, 기록되지 않아

03/30/2025 Python 실습 / 데이터사이언스

이상치(outlier) 쉽게 찾고 처리하는 법 – 예제로 배우기

“이상치(Outlier)“는 데이터 분석에서 자주 마주하게 되는 중요한 요소이다.이는 다른 데이터 포인트들과 현저히 다른 값을 가지는 관측값으로, 데이터 수집 과정의 오류일

03/10/2025 데이터사이언스

데이터 사이언스에서 사용하는 데이터 축소: 주요 알고리즘 정리

데이터 사이언스에서는 종종 매우 큰 데이터 세트를 다루게 된다. 그러나 데이터가 클수록 처리 속도가 느려지고, 분석의 복잡성이 증가할 수 있다.

02/18/2025 SQL

SQL 고급 마스터 – 대용량 데이터 최적화 및 AI 활용법

AI 및 데이터 분석 프로젝트에서 SQL 최적화는 필수적인 기술이다.이번 포스트에서는 대용량 데이터 처리, 인덱스 최적화, 실행 계획 분석, 데이터 웨어하우스

02/06/2025 SQL

SQL 중급 완전 정복 – JOIN, 집계 함수, 서브쿼리로 데이터 분석하기

머신러닝과 데이터 분석에서 SQL은 필수적인 도구이다.이번 포스트에서는 JOIN, 집계 함수, 서브쿼리를 사용하여 더욱 복잡한 데이터 분석을 수행하는 방법을 데이터 사이언스

12/31/2024 Python 실습 / 데이터사이언스

Principal Component Analysis (PCA): Understanding Data Reduction Algorithms with Python Implementation

In data science and machine learning, dealing with high-dimensional data is crucial for problem-solving. However, as the dimensionality increases, the

12/11/2024 Python 실습 / 엔지니어링

Streamlit과 외부 API 연동하기: 코드로 배우는 API연동 대시보드 제작

Streamlit은 데이터를 기반으로 한 애플리케이션 개발에 적합하며, 외부 API와의 통합은 Streamlit의 활용도를 한층 높여준다. 이번 포스트에서는 외부 API를 Streamlit과 연동하여