기술 성숙도 기술 성숙도 평가는 개발 기술의 성숙도 또는 이행단계를 평가하기 위한 정량화된 측정지표로, 연구 개발 환경(실험실, 유사환경, 실제환경), 연구개발
Continue reading[Python] pd.DataFrame().to_csv() 한글 깨짐 현상
df와 같이 한글이 포함된 DataFrame이 있고, 이를 df.to_csv() method로 파일 변환하고자 한다.그리고 csv를 다시 불러 들일 때 한글이 깨지는 경우가
Continue readingMS Bing 검색엔진과 AI챗봇, ChatGPT의 결합 그리고 Google의 AI챗봇 LaMDA
2023년 1월 3일, 언론매체 The Information은 마이크로소프트가 Bing 검색엔진에 OpenAI의 ChatGPT 기술을 적용할 것이라 보도했다. ChatGPT는 대화수준이 실제 인간의 것도
Continue reading미국 초등학교 학군 비교 분석 #2(Analysis of Elementary Schools by State in the United States)
이번에는 미국 초등학교의 Type 비교를 해보고자 한다.학교 Type은 Public, Private으로 구분되며, 데이터를 수집한 Great Schools은 학교와 교육에 대한 정보를 제공하는
Continue reading미국 초등학교 학군 비교 분석 #1(Analysis of Elementary Schools by State in the United States)
오늘 뉴스를 보다보니 이런 기사가 눈에 띄었다. 이대로면 2055년 국민연금 바닥난다…소진시점 2년 앞당겨져 Source: Naver 뉴스(연합뉴스) 여러 기사의 주 내용은
Continue reading[python] web crawling, selenium.webdriver.ChromeOptions() / 셀레니움 크롬옵션 설정 방법
자주 사용하는 동적 웹 크롤링(Selenium) 드라이버를 셋업 방법 user-agent 확인방법 chrome – F12 개발자도구 – Console(Element 옆) – navigator.userAgent 입력
Continue reading[한국데이터산업진흥원] 데이터산업 백서 정리. 2 – 정책 (Data Industry White Paper. 2 – Policy)
발간사 이후 처음으로 보이는 인포그래픽은 정책 과 법제도에 관한 이야기이다. 2011년부터 시작된 데이터베이스 산업 진흥 법안은 이후로 큰 변화가 없다가
Continue reading[한국데이터산업진흥원] 데이터산업 백서 정리. 1 (Data Industry White Paper. 1)
2022 데이터산업 백서의 발간사 첫 소절이며, 데이터 산업진흥원이 생각하는 미래의 데이터 산업이 가야 할 길을 말한다. 앞으로 데이터산업은 4차 산업혁명에
Continue reading[Python] Data 저장, 읽어오기(feat. pickle)
Web Crawling, 데이터 통계, 분석, ML 등을 진행하다 보면 생성되는 데이터들이 꽤 많다. 물론 Raw data를 기반으로 매번 script를 실행하여
Continue readingDataset Split(데이터세트 분리하기) – Training, Validation, Test
모델을 구축하거나 모형을 학습하고 평가 하기 위해서 Dataset이 필요하다.이때 Dataset은 성질에 맞게 3가지로 분류하여 사용한다. Dataset이 충분히 커서 Train을 위해
Continue reading