Dremio (on premise) - ПО для выполнение SQL запросов "поверх" файлов в DataLake. Пользователю не нужно обладать специальными компетенциями и знать все нюансы для запуска распределённых вычислений на большими данными. Достаточно просто написать SQL запрос. Кроме того, позволяет запускать SQL запросы и "джойнить" датасеты сразу из нескольких источниках данных: DataLake + DataLake, DataLake + DB
Cedrus (as service) - ПО для импортозамещения Dremio
Data Hub - OpenSource ПО для каталогизации данных компании: откуда данные, кто владелец, схема данных, содержат / нет ли ПДн, была ли дополнительная обработка данных, применялиь ли правила контроля качества данных и т.п
EDB - разработанное группой Self-Managed решение для управления топиками и доступами к ним в корпоративных Kafka кластерах.