文章目录
1.AVL树
在前面,我们已经介绍过了二叉搜索树,也了解到二叉搜索树查找的效率非常的高。但是在数据有序或接近有序时,它就会退化成单边树,那样效率就变得非常低了。所以我们也一直说二叉搜索树的搜索的时间复杂度是O(N)(高度次),并不是O(log2N)。
因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。
1.1 AVL树的概念
由于二叉搜索树可能会退化,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
为什么要求左右子树的高度之差不超过1就可以呢?
对于所有形状的子树来说,如果他有2n-1个节点,那它就可以保持绝对的平衡;如果他有2n (n >= 1)个节点,就无法做到绝对的平衡,最好的结果就是子树高度相差一。
一棵AVL树要么是空树,要么是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果他有n个节点,其高度可保持在log2N,搜索的时间复杂度就是log2N。
1.2 AVL树节点的定义
为了方便确认一棵树是否是AVL树,我们在节点中定义一个平衡因子,通过它来记录每棵树左右子树的高度。
如果右子树比左子树高一层,那平衡因子就是1;如果左右子树一样高,那平衡因子就是0;如果左子树比右子树高一层,那平衡因子就是-1。此时AVL树的性质都没有被打破。
当左子树比右子树高两层,那平衡因子就是-2;或者右子树比左子树高两层,平衡因子就是2,此时AAVL树的性质就被打破了,需要调整。
在调整失衡的AVL树时,我们需要频繁的访问其父节点,因此我们给每个节点定义一个指向父亲的指针
template<class K, class V> struct AVLTreeNode { pair<K, V> _kv; //存放数据 AVLTreeNode<K, V>* _left; AVLTreeNode<K, V>* _right; AVLTreeNode<K, V>* _prev; //指向当前节点的父亲 int _bf;//平衡因子 AVLTreeNode(const pair<K,V>& kv) :_kv(kv) ,_left(nullptr) ,_right(nullptr) ,prev(nullptr) ,_bf(0) {} };
1.3 AVL树的插入
AVL树的插入与普通二叉搜索树的插入基本一致。唯一的区别就是AVL树插入节点后需要判断AVL树是否失衡,存在失衡就需要调整。
我们平衡因子是使用右子树的高度-左子树的高度,因此,如果新节点插入到父节点的右边,那父亲的平衡因子+1;如果新节点插入到父亲节点的左边,那父亲的平衡因子-1。
对于情况二
来说,新节点的插入不会影响其祖先的平衡因子的改变
,因为子树的高度没有改变。
对于情况一来说,新节点的插入会影响其祖先的平衡因子的改变,因为子树的高度变高了。
所以,对于情况一来说,我们新插入节点后,还要观察其祖先的平衡因子是否变化,变化后是否需要调整。
那么下面我们就先将节点插入到树中:
bool insert(const pair<K, V>& kv) { //插入前是空树 if (_root == nullptr) { //新插入的节点就是根 _root = new Node(kv); _root->_prev = nullptr; return true; } else { Node* cur = _root; Node* parent = nullptr; //寻找插入位置 while (cur) { if (cur->_kv.first < kv.first) { parent = cur;//记录父节点,以便后序连接 cur = cur->_right; } else if (cur->_kv.first > kv.first) { parent = cur; cur = cur->_left; } else { return false;//节点已经存在,插入失败 } } //已找到了插入位置 cur = new Node(kv); //判断连接在父亲的哪一侧 if (parent->_kv.first < kv.first) parent->_right = cur; else parent->_left = cur; cur->_prev = parent;//指向父亲 //判断树是否失衡 //... } }
更新父亲/祖先的平衡因子
//判断树是否失衡 while (parent) { //更新父亲的平衡因子 if (parent->_left == cur) parent->_bf--; else parent->_bf++; if (parent->_bf == 0)//属于情况二,不影响祖先 break; //情况一,影响祖先的平衡因子,需要继续更新 else if (parent->_bf == 1 || parent->_bf == -1) { cur = parent; parent = cur->_prev; } else if (parent->_bf == 2 || parent->_bf == -2) { //旋转处理 break; } else { assert(false);//平衡因子异常了 } }
1.4 AVL树的旋转
AVL树的旋转分为四种情况:
- 左单旋
- 右单旋
- 左右双旋
- 右左双旋
下面,我们对这四种情况具体分析
1.4.1 左单旋
新节点插入到较高右子树的右侧- -左单旋
在旋转过程中,有以下几种情况需要考虑:
- 7节点的左孩子可能存在,也可能不存在
- 6可能是根节点,也可能是子树
- 如果是根节点,旋转完成后,根节点就是7
- 如果是子树,可能是某个节点的左子树,也可能是右子树,需要判断以后连接
void RotateL(Node* parent) { Node* subR = parent->_right;//父亲的右孩子 Node* subRL = subR->_left;//右孩子的左孩子 //升高度,连孙子 parent->_right = subRL; if (subRL) subRL->_prev = parent; Node* parentPrev = parent->_prev; //降高度,变父亲 subR->_left = parent; parent->_prev = subR; //连接旋转后的子树 subR->_prev = parentPrev; if (parentPrev == nullptr) { //如果原父亲就是根,旋转后的儿子变根 _root = subR; } else { //原父亲是子树,判断儿子连接在哪一边 if (parentPrev->_left == parent) parentPrev->_left = subR; else parentPrev->_right = subR; } //更新平衡因子 subR->_bf = 0; parent->_bf = 0; }
1.4.2 右单旋
新节点插入到较高左子树的左侧- - 右旋
在旋转过程中,有以下几种情况需要考虑:
- 5节点的右孩子可能存在,也可能不存在
- 6可能是根节点,也可能是子树
- 如果是根节点,旋转完成后,根节点就是5
- 如果是子树,可能是某个节点的左子树,也可能是右子树,需要判断以后连接
void RotateR(Node* parent) { Node* subL = parent->_left; Node* subLR = subL->_right; //升高度,连孙子 parent->_left = subLR; if (subLR) subLR->_prev = parent; Node* parentPrev = parent->_prev; //降高度,变父亲 subL->_right = parent; parent->_prev = subL; //新父亲指向前 subL->_prev = parentPrev; if (nullptr == parentPrev) { //如果原父亲就是根,旋转后的儿子变根 _root = subL; } else { //原父亲是子树,判断儿子连接在哪一边 if (parentPrev->_left == parent) parentPrev->_left = subL; else parentPrev->_right = subL; } subL->_bf = 0; parent->_bf = 0; }
1.4.3 右左双旋
新节点插入到较高右子树的左侧- -右左双旋
所以,为了解决这种情况,我们可以将这种歪脖树先变成一棵单边树,然后再进行单旋即可。
为了满足所有情况,我们下面使用抽象图再画一遍
观察上图我们可以发现,双旋就是一种抛弃自己的孩子,独自登基的感觉,因此对于旋转后平衡因子的改变,取决于新节点插入到哪一边,最后又到哪里去。
void RotateRL(Node* parent) { //由于单旋会改变节点的位置以及平衡因子,所以提前记录 Node* subR = parent->_right; Node* subRL = subR->_left; int bf = subRL->_bf; RotateR(parent->_right); RotateL(parent); //修改平衡因子 if (bf == 0)//subRL插入前是空 { parent->_bf = 0; subR->_bf = 0; subRL->_bf = 0; } else if (bf == 1)//subRL之前是一棵树,新节点插入其 右侧 { parent->_bf = -1; subR->_bf = 0; subRL->_bf = 0; } else //subRL之前是一棵树,新节点插入其 左侧 { parent->_bf = 0; subR->_bf = -1; subRL->_bf = 0; } }
1.4.4 左右双旋
新节点插入到较高左子树的右侧–左右双旋
最简单的情况,2的右子树插入前为空
抽象图
跟右左双旋基本一样,这里就不赘述了,咱们直接开旋。
平衡因子的改变也需要小心。
void RotateLR(Node* parent) { Node* subL = parent->_left; Node* subLR = subL->_right; int bf = subLR->_bf; RotateL(parent->_left); RotateR(parent); if (bf == 0) // subLR插入前为空 { parent->_bf = 0; subL->_bf = 0; subLR->_bf = 0; } else if (bf == 1) //subLR是一棵树,新节点插入到树的 右侧 { parent->_bf = 0; subL->_bf = -1; subLR->_bf = 0; } else //subLR是一棵树,新节点插入到树的 左侧 { parent->_bf = 1; subL->_bf = 0; subLR->_bf = 0; } }
下面就是更新平衡因子的整体思路:
//判断树是否失衡 while (parent) { //更新父亲的平衡因子 if (parent->_left == cur) parent->_bf--; else parent->_bf++; if (parent->_bf == 0)//属于情况二,不影响祖先 break; //情况一,影响祖先的平衡因子,需要继续更新 else if (parent->_bf == 1 || parent->_bf == -1) { cur = parent; parent = cur->_prev; } else if (parent->_bf == 2 || parent->_bf == -2) { //旋转处理 //左单旋 // p cur // cur ---> p new // new if (parent->_bf == 2 && cur->_bf == 1) RotateL(parent); //右单旋 // p cur // cur ---> new p // new else if (parent->_bf == -2 && cur->_bf == -1) RotateR(parent); //右左双旋 // p p cur // cur --> cur --> p new // new new else if (parent->_bf == 2 && cur->_bf == -1) RotateRL(parent); //左右双旋 // p p cur // cur --> cur --> new p // new new else if (parent->_bf == -2 && cur->_bf == 1) RotateLR(parent); else assert(false); break;//旋转后,以parent为根的树已经平衡,无需继续向上更新 } else { assert(false);//平衡因子异常了 }
总结:
假如以Parent为根的子树不平衡,即Parent的平衡因子为2或者-2,分以下情况考虑
- Parent的平衡因子为2,说明Parent的右子树高,设Parent的右子树的根为SubR
- 当SubR的平衡因子为1时,执行左单旋
- 当SubR的平衡因子为-1时,执行右左双旋
- Parent的平衡因子为-2,说明Parent的左子树高,设Parent的左子树的根为SubL
- 当SubL的平衡因子为-1是,执行右单旋
- 当SubL的平衡因子为1时,执行左右双旋
旋转完成后,原Parent为根的子树个高度降低,已经平衡,不需要再向上更新。
1.5 AVL树的平衡验证
AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:
- 验证其为二叉搜索树
- 如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
- 验证其为平衡树
- 每个节点子树高度差的绝对值不能超过1
- 节点的平衡因子是否计算正确
int Height(Node* root) { if (root == nullptr) return 0; int leftHeight = Height(root->_left); int rightHeight = Height(root->_right); return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1; } bool _isBalanceTree() { return isBalanceTree(_root); } bool isBalanceTree(Node* root) { if (root == nullptr)//空树也是平衡二叉搜索树 return true; int leftHeight = Height(root->_left); int rightHeight = Height(root->_right); int gap = rightHeight - leftHeight; //计算root的平衡因子 // 如果计算出的平衡因子与root的平衡因子不相等,或者 //root平衡因子的绝对值超过1,则一定不是AVL树 if (gap != root->_bf || (gap > 1 || gap < -1)) { return false; } return isBalanceTree(root->_left) && isBalanceTree(root->_right); }
1.6 AVL树的删除
- 因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除
- (分析有无左右孩子,若仅有一个孩子,则直接将删除节点连接孩子;若有两个孩子,将删除节点替换为删除节点的左子树的最大或右子树的最小)
- 然后再更新平衡因子,只不过与插入不同的是,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。
1.7 AVL树的性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即log2N。
但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。
因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。