‘결측치(Missing Data)‘란 데이터 세트에서 관찰되지 않거나 기록되지 않은 값들을 의미한다. 다양한 이유로 데이터 수집 과정에서 일부 정보가 누락되거나, 기록되지 않아
Continue reading
‘결측치(Missing Data)‘란 데이터 세트에서 관찰되지 않거나 기록되지 않은 값들을 의미한다. 다양한 이유로 데이터 수집 과정에서 일부 정보가 누락되거나, 기록되지 않아
Continue reading모집단 (Population) 정의 모집단은 관심의 대상이 되는 전체 집단을 의미한다. 이는 연구하고자 하는 특정 집단의 모든 구성원 또는 사건들을 포함한다.
Continue reading현대 데이터 분석 환경에서 다루는 데이터는 크게 정형 데이터(Structured Data)와 비정형 데이터(Unstructured Data)로 나뉜다.이 두 가지는 저장 방식, 구조, 처리
Continue reading표준편차 (Standard Deviation) 정의
수학적 표현:
표준편차가 알려주는 것 분산 (Variance)
정의
수학적 표현:
“이상치(Outlier)“는 데이터 분석에서 자주 마주하게 되는 중요한 요소이다.이는 다른 데이터 포인트들과 현저히 다른 값을 가지는 관측값으로, 데이터 수집 과정의 오류일
Continue reading가설 검정(Hypothesis Testing)을 처음 배우는 사람이라면 가장 먼저 마주하게 되는 수치가 바로 유의수준(significance level)이다. 특히 그중에서도 0.05, 왜 그렇게 자주
Continue reading데이터 사이언스에서는 종종 매우 큰 데이터 세트를 다루게 된다. 그러나 데이터가 클수록 처리 속도가 느려지고, 분석의 복잡성이 증가할 수 있다.
Continue readingAI 및 데이터 분석 프로젝트에서 SQL 최적화는 필수적인 기술이다.이번 포스트에서는 대용량 데이터 처리, 인덱스 최적화, 실행 계획 분석, 데이터 웨어하우스
Continue reading머신러닝과 데이터 분석에서 SQL은 필수적인 도구이다.이번 포스트에서는 JOIN, 집계 함수, 서브쿼리를 사용하여 더욱 복잡한 데이터 분석을 수행하는 방법을 데이터 사이언스
Continue reading데이터 기반 애플리케이션을 구축할 때 데이터베이스는 필수적인 요소이다. Streamlit은 간단한 코드만으로 웹 애플리케이션을 개발할 수 있을 뿐 아니라, SQLite와 같은
Continue reading