阅读量:1
Hive事务表更新
众所周知,Apache Hive 是建立在 Hadoop HDFS 之上的数据仓库框架。由于它包含表,您可能希望根据数据的变化更新表记录。直到最近,Apache Hive 还不支持事务。从 Hive 0.14 及以上版本开始支持事务性表。您需要启用 ACID 属性才能在 Hive 查询中使用更新、删除、合并。在本文中,我们将讨论如何在 Hive 事务性表上使用更新连接。
您也可以在不设置 ACID 属性的情况下更新 Hive 表。但在本文中,我们将使用 Hive 事务性表。更新连接通常用于增量加载,例如实现缓慢变化维表。
更多关于事物的可以参考
Hive进阶之事务初识 Transactional Tables
Hive进阶之事务初识 Transactional Tables
Hive 事务性表更新连接
Apache Hive 支持涉及您正在更新的单张表的简单更新语句。您可以在 SET 子句中仅使用静态值使用 Hive 更新语句。
例如,考虑以下带有静态值的简单更新语句。
sql UPDATE sales_by_month SET total_revenue = 14.60 WHERE store_id = 3;
实际上,更新语句要复杂得多,涉及两张或更多表。
例如,考虑以下使用两张表的更新语句。《Employee》表将使用《empl》表中存在的值进