经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » 编程经验 » 查看文章
二叉搜索树的实现与常见用法
来源:cnblogs  作者:GodBMW  时间:2018/10/24 9:09:19  对本文有异议

作者按:因为教程所示图片使用的是 github 仓库图片,网速过慢的朋友请移步《二叉搜索树的实现与常见用法》原文地址。更欢迎来我的小站看更多原创内容:godbmw.com,进行“姿势”交流 ?(^?^*)

1. 为什么需要二叉搜索树?

选择数据结构的核心在于解决问题,而不是为了使用而使用。

由于二叉搜索树的定义和特性,它可以高效解决以下问题:

  • 查找问题:二分查找
  • 高级结构:字典结构实现
  • 数据变动:节点的插入、删除
  • 遍历问题:前序、中序、后序和层次遍历
  • 数值运算:ceilfloor、找到第 n 大的元素、找到指定元素在排序好的数组的位置 等等

值得一提的是,除了遍历算法,上述各种问题的算法时间复杂度都是 : \(O(\log_2 n)\)

2. 二叉搜索树的定义和性质

二叉搜索树是一颗空树,或者具有以下性质的二叉树:

  • 若任意节点的左子树不空,则左子树上所有节点的值均小于它的根节点的值
  • 若任意节点的右子树不空,则右子树上所有节点的值均大于它的根节点的值
  • 任意节点的左、右子树也分别为二叉查找树
  • 没有键值相等的节点

需要注意的是,二叉搜索树不一定是一颗完全二叉树,因此,二叉搜索树不能用数组来存储。

3. 二叉搜索树的实现

第 3 部分实现的测试代码地址:https://gist.github.com/dongyuanxin/d0803a8821c6797e9ce8522a676cf44b

这是 Github 的 GIST,请自备梯子。

3.1 树结构实现

借助struct和指针模拟树的结构,并且将其封装到BST这个类之中:

  1. // BST.h
  2. // Created by godbmw.com on 2018/9/27.
  3. //
  4. #ifndef BINARYSEARCH_BST_H
  5. #define BINARYSEARCH_BST_H
  6. #include <iostream>
  7. #include <queue>
  8. using namespace std;
  9. template <typename Key, typename Value>
  10. class BST {
  11. private:
  12. struct Node {
  13. Key key;
  14. Value value;
  15. Node *left;
  16. Node *right;
  17. Node(Key key, Value value) {
  18. this->key = key;
  19. this->value = value;
  20. this->left = NULL;
  21. this->right = NULL;
  22. }
  23. Node(Node* node) {
  24. this->key = node->key;
  25. this->value = node->value;
  26. this->left = node->left;
  27. this->right = node->right;
  28. }
  29. };
  30. Node *root;
  31. int count;
  32. public:
  33. BST() {
  34. this->root = NULL;
  35. this->count = 0;
  36. }
  37. ~BST() {
  38. this->destroy(this->root);
  39. }
  40. int size() {
  41. return this->count;
  42. }
  43. bool isEmpty() {
  44. return this->root == NULL;
  45. }
  46. };
  47. #endif //BINARYSEARCH_BST_H

3.2 实现节点插入

插入采取递归的写法,思路如下:

  1. 递归到底层情况:新建节点,并且返回
  2. 非底层情况:如果当前键等于插入键,则更新当前节点的值;小于,进入当前节点的左子树;大于,进入当前节点的右子树。
  1. private:
  2. Node* insert(Node* node, Key key, Value value) {
  3. if(node == NULL) {
  4. count++;
  5. return new Node(key, value);
  6. }
  7. if(key == node->key) {
  8. node->value = value;
  9. } else if( key < node->key) {
  10. node->left = insert(node->left, key, value);
  11. } else {
  12. node->right = insert(node->right, key, value);
  13. }
  14. return node;
  15. }
  16. public:
  17. void insert(Key key, Value value) {
  18. this->root = this->insert(this->root, key, value);
  19. }

3.3 实现节点的查找

查找包含 2 个函数:containsearch。前者返回布尔型,表示树中是否有这个节点;后者返回指针类型,表示树中节点对应的值。

search为什么返回值的指针类型呢:

  • 如果要查找的节点不存在,指针可以直接返回NULL
  • 如果返回Node*,就破坏了类的封装性。原则上,内部数据结构不对外展示。
  • 如果查找的节点存在,返回去键对应的值,用户可以修改,并不影响树结构。
  1. private:
  2. bool contain(Node* node, Key key) {
  3. if(node == NULL) {
  4. return false;
  5. }
  6. if(key == node->key) {
  7. return true;
  8. } else if(key < node->key) {
  9. return contain(node->left, key);
  10. } else {
  11. return contain(node->right, key);
  12. }
  13. }
  14. Value* search(Node* node, Key key) {
  15. if(node == NULL) {
  16. return NULL;
  17. }
  18. if(key == node->key) {
  19. return &(node->value);
  20. } else if (key < node->key) {
  21. return search(node->left, key);
  22. } else {
  23. return search(node->right, key);
  24. }
  25. }
  26. public:
  27. bool contain(Key key) {
  28. return this->contain(this->root, key);
  29. }
  30. // 注意返回值类型
  31. Value* search(Key key) {
  32. return this->search(this->root, key);
  33. }

3.4 遍历实现

前序、中序和后序遍历的思路很简单,根据定义,直接递归调用即可。

对于层次遍历,需要借助队列queue这种数据结构。思路如下:

  1. 首先,将根节点放入队列
  2. 如果队列不空,进入循环
  3. 取出队列头部元素,输出信息。并将这个元素出队
  4. 将这个元素非空的左右节点依次放入队列
  5. 检测队列是否为空,不空的进入第 3 步;空的话,跳出循环。
  1. private:
  2. void pre_order(Node* node) {
  3. if(node != NULL) {
  4. cout<<node->key<<endl;
  5. pre_order(node->left);
  6. pre_order(node->right);
  7. }
  8. }
  9. void in_order(Node* node) {
  10. if(node != NULL) {
  11. in_order(node->left);
  12. cout<<node->key<<endl;
  13. in_order(node->right);
  14. }
  15. }
  16. void post_order(Node *node) {
  17. if(node != NULL) {
  18. post_order(node->left);
  19. post_order(node->right);
  20. cout<<node->key<<endl;
  21. }
  22. }
  23. void level_order(Node* node) {
  24. if(node == NULL) {
  25. return;
  26. }
  27. queue<Node*> q;
  28. q.push(node);
  29. while(!q.empty()) {
  30. Node* node = q.front();
  31. q.pop();
  32. cout<< node->key <<endl;
  33. if(node->left) {
  34. q.push(node->left);
  35. }
  36. if(node->right) {
  37. q.push(node->right);
  38. }
  39. }
  40. }
  41. public:
  42. void pre_order() {
  43. this->pre_order(this->root);
  44. }
  45. void in_order() {
  46. this->in_order(this->root);
  47. }
  48. void post_order() {
  49. this->post_order(this->root);
  50. }
  51. void level_order() {
  52. this->level_order(this->root);
  53. }

3.5 实现节点删除

为了方便实现,首先封装了获取最小键值和最大键值的两个方法:minimummaximum

删除节点的原理很简单(忘了什么名字,是一个计算机科学家提出的),思路如下:

  1. 如果左节点为空,删除本节点,返回右节点。
  2. 如果右节点为空,删除本节点,返回左节点。
  3. 如果左右节点都为空,是 1 或者 2 的子情况。
  4. 如果左右节点都不为空,找到当前节点的右子树的最小节点,并用这个最小节点替换本节点。

为什么第 4 步这样可以继续保持二叉搜索树的性质呢?

显然,右子树的最小节点,能满足小于右子树的所有节点,并且大于左子树的全部节点。

如下图所示,要删除58这个节点,就应该用59这个节点替换:

  1. private:
  2. // 寻找最小键值
  3. Node* minimum(Node* node) {
  4. if(node->left == NULL) {
  5. return node;
  6. }
  7. return minimum(node->left);
  8. }
  9. // 寻找最大键值
  10. Node* maximum(Node* node) {
  11. if(node->right == NULL) {
  12. return node;
  13. }
  14. return maximum(node->right);
  15. }
  16. Node* remove_min(Node* node) {
  17. if(node->left == NULL) {
  18. Node* right = node->right;
  19. delete node;
  20. count--;
  21. return right;
  22. }
  23. node->left = remove_min(node->left);
  24. return node;
  25. }
  26. Node* remove_max(Node* node) {
  27. if(node->right == NULL) {
  28. Node* left = node->left;
  29. delete node;
  30. count--;
  31. return left;
  32. }
  33. node->right = remove_max(node->right);
  34. return node;
  35. }
  36. // 删除掉以node为根的二分搜索树中键值为key的节点
  37. // 返回删除节点后新的二分搜索树的根
  38. Node* remove(Node* node, Key key) {
  39. if(node == NULL) {
  40. return NULL;
  41. }
  42. if(key < node->key) {
  43. node->left = remove(node->left, key);
  44. } else if(key > node->key){
  45. node->right = remove(node->right, key);
  46. } else {
  47. // key == node->key
  48. if(node->left == NULL) {
  49. Node* right = node->right;
  50. delete node;
  51. count--;
  52. return right;
  53. }
  54. if(node->right == NULL) {
  55. Node *left = node->left;
  56. delete node;
  57. count--;
  58. return left;
  59. }
  60. // node->right != NULL && node->left != NULL
  61. Node* successor = new Node(minimum(node->right));
  62. count++;
  63. // "count --" in "function remove_min(node->right)"
  64. successor->right = remove_min(node->right);
  65. successor->left = node->left;
  66. delete node;
  67. count--;
  68. return successor;
  69. }
  70. return node;
  71. }
  72. public:
  73. // 寻找最小键值
  74. Key* minimum() {
  75. if(this->count == 0) return NULL;
  76. Node* min_node = this->minimum(this->root);
  77. return &(min_node->key);
  78. }
  79. // 寻找最大键值
  80. Key* maximum() {
  81. if(this->count == 0) return NULL;
  82. Node* max_node = this->maximum(this->root);
  83. return &(max_node->key);
  84. }
  85. void remove_min() {
  86. if(this->root == NULL) {
  87. return;
  88. }
  89. this->root = this->remove_min(this->root);
  90. }
  91. void remove_max() {
  92. if(this->root == NULL) {
  93. return;
  94. }
  95. this->root = this->remove_max(this->root);
  96. }
  97. void remove(Key key) {
  98. this->root = remove(this->root, key);
  99. }

3.6 数值运算:floorceil

floorceil分别是地板和天花板的意思。在一个数组中,对于指定元素n,如果数组中存在n,那么n的两个值就是它本身;如果不存在,那么分别是距离最近的小于指定元素的值 和 距离最近的大于指定元素的值。

  1. private:
  2. Node* floor(Node* node, Key key) {
  3. if(node == NULL) {
  4. return NULL;
  5. }
  6. // key等于node->key:floor的结果就是node本身
  7. if(node->key == key) {
  8. return node;
  9. }
  10. // key小于node—>key:floor的结果肯定在node节点的左子树
  11. if(node->key > key) {
  12. return floor(node->left, key);
  13. }
  14. // key大于node->key:右子树可能存在比node->key大,但是比key小的节点
  15. // 如果存在上述情况,返回这个被选出来的节点
  16. // 否则,函数最后返回node本身
  17. Node* tmp = floor(node->right, key);
  18. if(tmp != NULL) {
  19. return tmp;
  20. }
  21. return node;
  22. }
  23. Node* ceil(Node* node, Key key) {
  24. if(node == NULL) {
  25. return NULL;
  26. }
  27. if(node->key == key) {
  28. return node;
  29. }
  30. if(node->key < key) {
  31. return ceil(node->right, key);
  32. }
  33. Node* tmp = ceil(node->left, key);
  34. if(tmp != NULL) {
  35. return tmp;
  36. }
  37. return node;
  38. }
  39. public:
  40. Key* floor(Key key) {
  41. Key* min_key = this->minimum();
  42. if(this->isEmpty() || key < *min_key) {
  43. return NULL;
  44. }
  45. // floor node
  46. Node *node = floor(this->root, key);
  47. return &(node->key);
  48. }
  49. Key* ceil(Key key) {
  50. Key* max_key = this->maximum();
  51. if(this->isEmpty() || key > *max_key) {
  52. return NULL;
  53. }
  54. // ceil node
  55. Node* node = ceil(this->root, key);
  56. return &(node->key);
  57. }

4. 代码测试

第 3 部分实现的测试代码地址:https://gist.github.com/dongyuanxin/759d16e1ce87913ad2f359d49d5f5016

这是 Github 的 GIST,请自备梯子。

5. 拓展延伸

考虑一种数据类型,如果是基本有序的一组数据,一次insert进入二叉搜索树,那么,二叉搜索树就退化为了链表。此时,上述所有操作的时间复杂度都会退化为 \(O(log_2 N)\)

为了避免这种情况,就有了红黑树等数据结构,来保证树的平衡性:左右子树的高度差小于等于 1。

6. 致谢

本篇博客是总结于慕课网的《学习算法思想 修炼编程内功》的笔记,强推强推强推。

二分搜索树的删除节点操作

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号