CedrusData Engine — SQL-движок для Lakehouse

Основные сложности при построении современной data-архитектуры

1.

Постоянная нехватка данных и вычислительных ресурсов, рост расходов

Текущие потоки интеграции не содержат необходимых данных или не эффективны. Департаменты конкурируют друг с другом за доступ к данным изолированных систем. Расходы бюджета на вычислительные ресурсы не успевают за потребностями бизнеса. Инфраструктура экстренно наращивается в узких местах с высоким перерасходом бюджета

2.

Потеря скорости в принятии решений

Фрагментарность данных и необходимость их постоянной консолидации превращают каждый новый аналитический запрос в длительный проект. Бизнес-подразделения теряют оперативность принятия решений, поскольку актуальная информация оказывается недоступной в нужный момент

CedrusData Engine — мощный SQL-движок как основа аналитической архитектуры

Высокая производительность и масштабируемость

СedrusData Engine выполняет сложные аналитические запросы даже для очень больших наборов данных. Динамическое управление памятью в реальном времени уменьшает ее использование, что повышает производительность и стабильность работы системы

Экономический эффект и контроль расходов

Отделение слоя вычислений (исполнения запросов) от слоя хранения данных позволяет эластично масштабировать инфраструктуру без перемещения данных. CedrusData Engine служит единым окном доступа к данным любого формата, минимизируя потребность в сложных и дорогостоящих ETL-инструментах и сокращая объем работ на интеграции данных между системами

Современная открытая архитектура

CedrusData Engine является ключевым компонентом для построения современных архитектур, таких как Data Lakehouse. Использование открытых табличных форматов, таких как Apache Iceberg вместе с парадигмой Lakehouse позволят легко адаптировать архитектуру вашей платформы под новые решения в будущем и избежать Vendor Lock

Гибкость интеграции и универсальный доступ

Движок позволяет выполнять сложные операции над данными из разных источников: СУБД, DWH, Data Lake, без перестройки существующей инфраструктуры. Это дает возможность строить архитектуры Data Fabric и Data Mesh, обеспечивая унифицированный доступ к данным в масштабах всей организации

Преимущества CedrusData Engine

Основан на Trino с нативным Rust runtime для максимальной производительности на больших данных

Работа с открытыми форматами через Apache Iceberg без привязки к вендору

Современный оптимизатор запросов с материализацией промежуточных вычислений для ускорения обработки

Многоуровневое кэширование и расширенный аудит всех операций с данными

Авторизация корпоративного уровня через CedrusData Catalog или OPA. Имперсонация пользователей при работе с внешними источниками

Расширенный аудит доступа к объектам каталога и аудит действий администратора

Web UI для выполнения и мониторинга SQL-запросов, управления политиками доступа

Быстрое внедрение решений благодаря Kubernetes и гибкой cloud-native архитектуре

Эффективное использование ресурсов с автоматическим масштабированием под нагрузку