데이터분석 - DEEPLINK CORE Lab

유의수준 0.05란? 왜 통계에서는 항상 0.05를 쓸까?

통계 공부를 시작하면 가장 먼저 접하게 되는 수치가 바로 유의수준 0.05입니다.하지만 왜 하필 0.05일까요? 0.01도 있고 0.1도 있는데, 0.05는 어떻게

‘결측치(Missing Data)‘란 데이터 세트에서 관찰되지 않거나 기록되지 않은 값들을 의미한다. 다양한 이유로 데이터 수집 과정에서 일부 정보가 누락되거나, 기록되지 않아

모집단 (Population) 정의 모집단은 관심의 대상이 되는 전체 집단을 의미한다. 이는 연구하고자 하는 특정 집단의 모든 구성원 또는 사건들을 포함한다.

현대 데이터 분석 환경에서 다루는 데이터는 크게 정형 데이터(Structured Data)와 비정형 데이터(Unstructured Data)로 나뉜다.이 두 가지는 저장 방식, 구조, 처리

표준편차 (Standard Deviation) ✅ 정의 🧮 수학적 표현: 📌 표준편차가 알려주는 것 분산 (Variance) ✅ 정의 🧮 수학적 표현: 📌

“이상치(Outlier)“는 데이터 분석에서 자주 마주하게 되는 중요한 요소이다.이는 다른 데이터 포인트들과 현저히 다른 값을 가지는 관측값으로, 데이터 수집 과정의 오류일

데이터 사이언스에서는 종종 매우 큰 데이터 세트를 다루게 된다. 그러나 데이터가 클수록 처리 속도가 느려지고, 분석의 복잡성이 증가할 수 있다.

AI 및 데이터 분석 프로젝트에서 SQL 최적화는 필수적인 기술이다.이번 포스트에서는 대용량 데이터 처리, 인덱스 최적화, 실행 계획 분석, 데이터 웨어하우스

머신러닝과 데이터 분석에서 SQL은 필수적인 도구이다.이번 포스트에서는 JOIN, 집계 함수, 서브쿼리를 사용하여 더욱 복잡한 데이터 분석을 수행하는 방법을 데이터 사이언스

데이터 기반 애플리케이션을 구축할 때 데이터베이스는 필수적인 요소이다. Streamlit은 간단한 코드만으로 웹 애플리케이션을 개발할 수 있을 뿐 아니라, SQLite와 같은