SobesLab логотип SobesLab

Ответ

Хранилище-озеро vs классический склад данных; Data Lake – сырые разнородные данные хранятся как файлы (например, на HDFS/S3), дешево и объёмно, для исследовательского анализа и ML, но требуют обработки при чтении; DWH – структурированные данные (схема), агрегированные и чистые, для быстрых BI-запросов (Teradata, ClickHouse); озеро гибкое, но медленное на запросах, DWH быстрый, но жестче по структуре и предварительной подготовке данных.