# 二分查找

[TOC]

先了解一下简单查找:很简单就是一个一个的查找效率非常低,打个比方都玩过的猜数字游戏,小明心里想着一个 1 到 100 之间其中一个数组让小李猜这个数字是多少,如果小李一个一个的从 1 开始猜到 100 那么显然是很慢很笨拙的,我们再来说说二分查找,回到主题就是将问题拆分为半,让小李同学不再一个一个的去试

在二分查找中,目标元素的查找区间的定义十分重要,不同的区间的定义写法不一样

因为查找的区间是不断迭代的,所以确定查找的范围十分重要,主要就是左右区间的开和闭的问题,对应的迭代方式也不一样有以下两种方式:

  • 左闭右闭 [left,right]
  • 左闭右开 [left,right]

# 例子🌰

<u> 这是一个使用二分查找的例题 </u>

题目如下:

给定一个人 n 个元素有序的 (升序) 整形数组 nums 和一个目标值 target, 写一个函数搜索 nums 中的 target, 如果目标值存在返回下标,不存在返回 - 1

可参考 Leetcode 中的二分查找题

示例一:

输入:nums = [-1,0,3,5,9,12],target = 9

输出: 4

解释: 9 出现在 nums 中并且下标为 4

示例二:

输入:nums = [-1,0,3,5,9,12],target = 2

输出: -1

解释: 2 不存在 nums 中因此返回 - 1


提示:

  • 你可以假设 nums 中的所有元素是不重复的
  • n 将在 [1-10000] 之间
  • nums 的每个元素都将在 [-9999,9999] 之间

二分法的思想很简单,因为整个数组是有序的,数组默认是递增的

  • 首先选择数组中间的数字和需要查找的目标值比较

  • 如果相等最好,就可以直接返回答案了

  • 如果不相等

    • int mid = left + (right + left) / 2; 取中间位置为起始位置

    • 如果中间的数字大于目标值,则中间数字向右所有数字都大于目标值 全部排除

      target < nums[mid]

      left = mid + 1;

    • 如果中间的数字小于目标值,则中间数字向左所有数字都小于目标值 全部排除

      target > nums[mid]

      right = mid - 1;

tips: 不用去纠结数组的长度是奇数或偶数的时候,怎么取长度的一半,一下说明,可以跳过

image-20231231120458461

因为 29 大于中间的数字大于 11, 所以左边的所有数字全部排除

image-20231231120517194

如果数组长度为奇数

image-20231231120539797

不要一直纠结中间的数字两边的数字数量不一样这个问题,因为:

  • 两边数量不一样是一定会出现的情况
  • 但是这种情况并不影响我们对中间数字和目标值数字大小关系的判断
    • 只要中间数字大于目标数字,就排除右边
    • 只要中间数字小于目标数字,就排除左边

所以数组长度是偶数还是奇数这个真的不重要,不影响怎么排除的问题,无非是多排除一个数字或者少排除一个数字

  • 真正影响的是中间那个数字到底该不该加入下一次的查找中,也就是边界问题

# 正向写法

int search(int nums[], int size, int target) //nums 是数组,size 是数组的大小,target 是需要查找的值
{
    int left = 0;
    int right = size - 1;	// 定义了 target 在左闭右闭的区间内,[left, right]
    while (left <= right) {	// 当 left == right 时,区间 [left, right] 仍然有效
        int middle = left + ((right - left) / 2);// 等同于 (left + right) / 2,防止溢出
        if (nums[middle] > target) {
            right = middle - 1;	//target 在左区间,所以 [left, middle - 1]
        } else if (nums[middle] < target) {
            left = middle + 1;	//target 在右区间,所以 [middle + 1, right]
        } else {	// 既不在左边,也不在右边,那就是找到答案了
            return middle;
        }
    }
    // 没有找到目标值
    return -1;
}

image-20231231120551545

  • 首先,对 left 的值和 right 的值进行初始化,然后计算 middle 的值
    • left = 0,right = size - 1;
    • middle = (left + (right - left) / 2);

image-20231231120607255

  • 比较 nums [middle] 的值和 target 的值大小关系

    • if(nums[middle] > target) , 代表 middle 向右所有的数字大于 target
    • if(nums[middle] < target) , 代表 middle 向左所有的数字小于 target
    • 既不大于也不小于就是找到了相等的值
  • nums[middle] = 13 < target = 33,left = middle + 1;

image-20231231120624373

  • 循环条件为 while(left <= right)
  • 此时, left = 6 <= tight ==11; , 则继续进行循环
  • 当前 middle = left + ((right - left) / 2); 计算出 middle 的值

image-20231231120633977

  • 计算出 middle 的值后,比较 nums [middle] 和 target 的值,发现:
    • nums [middle] == 33 == target == 33, 找到目标值,结束并返回结果

# 反向写法 (也就是循环长度不够从未达不到要找到目标值的要求)

对应第一种正向的写法,我们把循环条件修改看看会发生什么事

  • 原查找区间 [left,right]
  • 原循环条件是 while(left <= right)

修改后题目对应的条件:

  • 查找区间不变,仍然是 [left,right]
  • 查找数字为 27 (target = 27)
  • 循环条件修改为 while(left < right)
int search(int nums[], int size, int target) 
{
    int left = 0;
    int right = size - 1;	
    while (left < right) {	//left <= right 修改为 left < right, 其他不变
        int middle = left + ((right - left) / 2);
        if (nums[middle] > target) {
            right = middle - 1;
        } else if (nums[middle] < target) {
            left = middle + 1;
        } else {	
            return middle;
        }
    }
    // 没有找到目标值
    return -1;
}

图片模拟过程:

image-20231231120644466

image-20231231120654543

image-20231231120711001

image-20231231120731761

image-20231231120746071

image-20231231120756931

  • 因为 nums [middle] = 22 < target = 27, 此时 left = middle + 1, 此时 left = tight, 而循环条件为 while (left < right), 所以还未找到 27 的情况下算法就跳出了循环,返回 - 1

image-20231231120806956

# 第二种写法 (左闭右开)

# 正向写法

第二种写法:每次查找的区间在 [left,right],(左闭右开区间), 根据区间的定义,条件控制应该如下:

  • 循环条件使用 while(left < right)
  • if(nums[middle] > target), right = minddle 因为当前的 nums [middle] 是大于 target 的,不符合条件,不能取到 middle, 并且区间的定义是 [left,right], 刚好区间上的定义就去不到 right, 所以 right 赋值为 middle
int search(int nums[], int size, int target)
{
	int left = 0;
	int right = size; // 定义 target 在左闭右开的区间里,即 [left, right)
	while (left < right) {	// 因为 left = right 的时候,在 [left, right) 区间上无意义
		int middle = left + ((right - left) / 2);
		if (nums[middle] > target) {
			right = middle; //target 在左区间,在 [left, middle) 中 
		} else if (nums[middle] < target) {
			left = middle + 1;
		} else {
			return middle;
		}
	} 
    // 没找到就返回 - 1
	return -1;
}

图片演示过程

  • 需要查找的值为 3

第一步是初始化 left 和 right 的值,然后计算 middle 的值

  • left = 0,right = size
  • 循环条件 while(left < right)

image-20231231120820787

image-20231231120829965

  • 比较 nums [middle] 和 target 的大小,因为 nums [middle] = 22 > target = 3
  • 所以 right = middle

image-20231231120843105

image-20231231120852453

  • 比较 nums [middle] 和 target 的大小,因为 nums [middle] = 9 > target = 3
  • 所以 right = middle

image-20231231120904716

image-20231231120918355

  • 比较 nums [middle] 和 target 的大小关系,因为 nums [middle] = 0 < target = 3
  • 所以 left = middle + 1

image-20231231120930841

  • 比较 nums [middle] 和 target 的关系,nums [middle] = 3 == target = 3
  • 成功找到 target

# 反向写法 (错误演示)

对应第二种正确的写法,照样把循环条件修改,看会发生什么事

正确的写法中条件为:

  • 查找原区间 [left,right]
  • 循环条件为 while(left < right)

修改后题目对应的条件:

  • 查找区间不变,仍然是 [left,right]
  • 循环条件修改为: while(left <= right)
  • 查找的数字为 26 (数组中不存在这个数字)
int search(int nums[], int size, int target)
{
	int left = 0;
	int right = size; 
	while (left <= right) {	// 条件 left < right 修改为 left <= right
		int middle = left + ((right - left) / 2);
		if (nums[middle] > target) {
			right = middle; 
		} else if (nums[middle] < target) {
			left = middle + 1;
		} else {
			return middle;
		}
	} 
    // 没找到就返回 - 1
	return -1;
}

image-20231231120946528

image-20231231120959665

  • 判断 nums [middle] 和 target 的大小关系,nums [middle] = 22 < target = 26
  • left = middle + 1 (其实这里 nums [left] 已经等于 27,26 不可能找到,接下去就看算法是否能够知道数组中不存在 26 并且返回 - 1 了)

image-20231231121015346

image-20231231121037637

  • 判断 nums [middle] 和 target 的大小关系:nums [middle] = 57 > target = 26
  • right = middle

image-20231231121055227

image-20231231121104741

  • 比较 nums [middle] 和 target 的大小关系:nums [middle] = 33 > target = 26
  • right = middle

image-20231231121113787

image-20231231121128288

  • 比较 nums [middle] 和 target 大小关系,因为 nums [middle] = 27 > target = 26
  • 所以 right = middle, 自此 left 和 right 相遇,但是循环条件被我们修改成 while(left <= right) 会接着做循环

image-20231231121144370

  • 接下来就是死循环
  • 因为 middle = left + ((right - left) / 2), 当 left = right 的时候,middle 的值不会继续改变
  • middle 不继续改变,由于 right = middle,right 也不会改变,所以三个数字自此开始不会继续改变
  • 循环条件 while(left <= right) 却仍然满足,不会跳出循环
  • 死循环....

# 总结

二分最重要的两个点,就是循环条件后续的区间赋值问题

image-20231231121153303

因为两者是互相联系,互相影响的,所以就需要两者统一,如果两者不统一,就会出现问题,所以循环条件和赋值问题必须统一,也就是循环不变量