[데이터 웨어하우스와 데이터 레이크]
⊙ 대학과 같은 고등교육 기관 IT 리더는 각 기관의 데이터 스토리지(data storage) 요구 사항에 맞는 솔루션을 선택해야 함.
⊙ 데이터 웨어하우스 및 데이터 레이크는 기관의 데이터를 유용하게 만드는 데 도움이 됨.
⊙ 데이터 웨어하우스와 데이터 레이크의 차이점
1) 데이터 웨어하우스(Data Warehouse)
- 쿼리 이전에 데이터를 미리 정의된 구조로 매핑
- 여러 소스의 데이터를 사용하여 복잡한 쿼리에 응답 가능
- 사용자 정의 데이터 세트에서 데이터를 추출하기 위해 쿼리가 작성됨.
2) 데이터 레이크(Data Lake)
- 쿼리가 발생할 때까지 구조를 적용하지 않고 모든 유형의 데이터를 수집함.
- 데이터 과학자, 머신러닝 모델 관련 전문가의 영역에 놓이는 부분이 있음.
- 여러 소스에서 방대한 양의 데이터를 분석해야 하는 경우에 적합함.
⊙ 데이터 웨어하우스와 데이터 레이크는 상호 배타적이지 않으며, 단순히 어떤 걸 고를지 선택하는 것만이 아니라 데이터 관리 솔루션을 구축하는 관점에서 생각해봄직 함.