이번에는 미국 초등학교의 Type 비교를 해보고자 한다.학교 Type은 Public, Private으로 구분되며, 데이터를 수집한 Great Schools은 학교와 교육에 대한 정보를 제공하는
Continue reading[월:] 2023년 01월
미국 초등학교 학군 비교 분석 #1(Analysis of Elementary Schools by State in the United States)
오늘 뉴스를 보다보니 이런 기사가 눈에 띄었다. 이대로면 2055년 국민연금 바닥난다…소진시점 2년 앞당겨져 Source: Naver 뉴스(연합뉴스) 여러 기사의 주 내용은
Continue reading[python] web crawling, selenium.webdriver.ChromeOptions() / 셀레니움 크롬옵션 설정 방법
자주 사용하는 동적 웹 크롤링(Selenium) 드라이버를 셋업 방법 user-agent 확인방법 chrome – F12 개발자도구 – Console(Element 옆) – navigator.userAgent 입력
Continue reading[한국데이터산업진흥원] 데이터산업 백서 정리. 2 – 정책 (Data Industry White Paper. 2 – Policy)
발간사 이후 처음으로 보이는 인포그래픽은 정책 과 법제도에 관한 이야기이다. 2011년부터 시작된 데이터베이스 산업 진흥 법안은 이후로 큰 변화가 없다가
Continue reading[한국데이터산업진흥원] 데이터산업 백서 정리. 1 (Data Industry White Paper. 1)
2022 데이터산업 백서의 발간사 첫 소절이며, 데이터 산업진흥원이 생각하는 미래의 데이터 산업이 가야 할 길을 말한다. 앞으로 데이터산업은 4차 산업혁명에
Continue reading[Python] Data 저장, 읽어오기(feat. pickle)
Web Crawling, 데이터 통계, 분석, ML 등을 진행하다 보면 생성되는 데이터들이 꽤 많다. 물론 Raw data를 기반으로 매번 script를 실행하여
Continue readingDataset Split(데이터세트 분리하기) – Training, Validation, Test
모델을 구축하거나 모형을 학습하고 평가 하기 위해서 Dataset이 필요하다.이때 Dataset은 성질에 맞게 3가지로 분류하여 사용한다. Dataset이 충분히 커서 Train을 위해
Continue reading정형 데이터와 비정형 데이터의 차이점(Structured, Unstructured Data, What is Difference?)
정형 데이터(Structured Data) 란?정형 데이터는 구조화된 데이터라고도 말하며 표준화된 형식이고, 구조가 잘 정의되어 있으며, 데이터 모델을 준수하고, 지속적인 순서를 따르고,
Continue reading