Apache Iceberg
Apache Iceberg е високопроизводителен формат на таблици с отворен код, предназначен за масивни аналитични масиви от данни. Първоначално разработен от Netflix с цел решаване на дългогодишни проблеми с надеждността и производителността в традиционните Hive формати, проектът по-късно става част от фондацията Apache (Apache Software Foundation). Iceberg позволява на обработващи енджини като Apache Spark, Trino, Flink и Presto безопасно да работят с едни и същи таблици едновременно, като гарантира ACID трансакции. Поддържа разширени функционалности като скрита партиция (hidden partitioning), еволюция на схемата без пренаписване на данни (schema evolution), пътуване във времето (time travel) и бързо сканиране на метаданни.