DataAnalysis - DEEPLINK CORE Lab

04/06/2025 Python 실습 / 데이터사이언스

결측치 처리 방법 완벽 정리: 유형별 대처 전략과 실무 적용법

‘결측치(Missing Data)‘란 데이터 세트에서 관찰되지 않거나 기록되지 않은 값들을 의미한다. 다양한 이유로 데이터 수집 과정에서 일부 정보가 누락되거나, 기록되지 않아

04/04/2025 데이터사이언스

통계와 데이터 분석을 위한 [모집단]과 [표본]의 차이

모집단 (Population) 정의 모집단은 관심의 대상이 되는 전체 집단을 의미한다. 이는 연구하고자 하는 특정 집단의 모든 구성원 또는 사건들을 포함한다.

03/31/2025 데이터사이언스

표준편차 vs 분산 차이 완벽 정리 (데이터 분석 핵심 개념)

표준편차 (Standard Deviation) ✅ 정의 🧮 수학적 표현: 📌 표준편차가 알려주는 것 분산 (Variance) ✅ 정의 🧮 수학적 표현: 📌

03/30/2025 Python 실습 / 데이터사이언스

이상치(outlier) 쉽게 찾고 처리하는 법 – 예제로 배우기

“이상치(Outlier)“는 데이터 분석에서 자주 마주하게 되는 중요한 요소이다.이는 다른 데이터 포인트들과 현저히 다른 값을 가지는 관측값으로, 데이터 수집 과정의 오류일

03/30/2025 Python 실습 / 데이터사이언스

평균·중앙값·모드 차이 쉽게 이해하기 (예제 포함)

데이터 분석에서 ‘중심 경향성’을 이해하는 것은 필수이다.평균(Mean), 중앙값(Median), 모드(Mode)는 데이터를 요약하고 해석할 때 가장 기본이 되는 개념으로, 각각 다른 방식으로

03/10/2025 데이터사이언스

데이터 사이언스에서 사용하는 데이터 축소: 주요 알고리즘 정리

데이터 사이언스에서는 종종 매우 큰 데이터 세트를 다루게 된다. 그러나 데이터가 클수록 처리 속도가 느려지고, 분석의 복잡성이 증가할 수 있다.

12/31/2024 Python 실습 / 데이터사이언스

Principal Component Analysis (PCA): Understanding Data Reduction Algorithms with Python Implementation

In data science and machine learning, dealing with high-dimensional data is crucial for problem-solving. However, as the dimensionality increases, the

12/11/2024 Python 실습 / 엔지니어링

Streamlit과 외부 API 연동하기: 코드로 배우는 API연동 대시보드 제작

Streamlit은 데이터를 기반으로 한 애플리케이션 개발에 적합하며, 외부 API와의 통합은 Streamlit의 활용도를 한층 높여준다. 이번 포스트에서는 외부 API를 Streamlit과 연동하여

11/19/2024 Python 실습 / 데이터사이언스

t-SNE: 데이터 시각화를 위한 강력한 차원 축소 알고리즘과 Python 구현

데이터 사이언스과 머신러닝에서 고차원 데이터는 매우 일반적이다. 하지만 고차원 데이터를 분석하고 시각화하는 것은 쉽지 않다. 이를 해결하기 위해 t-SNE(t-Distributed Stochastic

11/08/2024 Python 실습 / 데이터사이언스

선형 판별 분석(LDA): 데이터 차원 축소 알고리즘의 이해와 Python 구현

데이터 사이언스와 머신러닝에서 차원 축소는 분석 및 모델링의 성능을 높이기 위해 매우 중요한 과정이다. 그 중 선형 판별 분석(LDA, Linear