데이터 레이크란?
데이터 레이크(Data Lake)는 대량의 데이터를 생성되는 원시 형식으로 보관하는 중앙 위치를 말한다.
기존의 계층적 데이터 웨어하우스(파일이나, 폴더에 저장하는)와 다르게 메타 데이터 태그와 고유 식별자로 데이터를 저장하므로 쉽게 찾을 수 있어, 데이터의 검색하는 성능을 향상 시킬 수 있다.
데이터 레이크하우스란?
데이터 레이크하우스(Data Lakehouse)는 데이터 레이크가 가지고 있는 장점에 데이터 웨어하우스의 데이터 관리기능과 ACID 트랜잭션※을 통합한 형태의 데이터 관리 아키텍쳐이다.

데이터 레이크(Data Lake)는 다양한 형식의 원시 데이터를 처리하여 대용량 병렬 처리를 할 수 있지만, 트랜잭션을 지원하지 않고, 일관성과, 격리가 부족해 배치작업과 스트리밍 작업을 하기에 적합하지 않았다.
데이터 웨어하우스(Data Warehouse)의 동시 사용자, SQL Interface 장점과 데이터 레이크의 장점을 합쳐 다양한 사용자 Needs에 맞게 활용 가능한 데이터 레이크하우스(Data Lakehouse)로 전환하게 되면 모든 데이터를 기반으로 비지니스 인텔리전스(Business Intelligence)와 머신 러닝(Machine Learning)을 모두 지원할 수 있게 된다.
Source: Databricks, AWS