找回密码
 立即注册
首页 业界区 科技 数据结构与算法之ACM Fellow-算法2.4 优先队列 ...

数据结构与算法之ACM Fellow-算法2.4 优先队列

杼氖 昨天 10:36
数据结构与算法之ACM Fellow-算法2.4 优先队列

许多应用程序都需要处理有序的元素,但不一定要求它们全部有序,或是不一定要一次就将它们排序。很多情况下我们会收集一些元素,处理当前键值最大的元素,然后再收集更多的元素,再处理当前键值最大的元素,如此这般。例如,你可能有一台能够同时运行多个应用程序的电脑(或者手机)。这是通过为每个应用程序的事件分配一个优先级,并总是处理下一个优先级最高的事件来实现的。例如,绝大多数手机分配给来电的优先级都会比游戏程序的高。
IT优质资源下载地址:
对应视频资源地址:资源网盘分享
更多资源资源群 资源群
群满加新共享群:备份群
在这种情况下,一个合适的数据结构应该支持两种操作: 删除最大元素插入元素。这种数据类型叫做 优先队列。优先队列的使用和队列(删除最老的元素)以及栈(删除最新的元素)类似,但高效地实现它则更有挑战性。
在本节中,简单地讨论优先队列的基本表现形式(其一或者两种操作都能在线性时间内完成)之后,我们会学习基于 二叉堆 数据结构的一种优先队列的经典实现方法,用数组保存元素并按照一定条件排序,以实现高效地(对数级别的) 删除最大元素插入元素操作
优先队列的一些重要的应用场景包括模拟系统,其中事件的键即为发生的时间,而系统需要按照时间顺序处理所有事件;任务调度,其中键值对应的优先级决定了应该首先执行哪些任务;数值计算,键值代表计算错误,而我们需要按照键值指定的顺序来修正它们。在第 6 章中我们会学习一个具体的例子,展示优先队列在粒子碰撞模拟中的应用。
通过插入一列元素然后一个个地删掉其中最小的元素,我们可以用优先队列实现排序算法。一种名为 堆排序 的重要排序算法也来自于基于堆的优先队列的实现。稍后在本书中我们会学习如何用优先队列构造其他算法。在第 4 章中我们会看到优先队列如何恰到好处地抽象若干重要的图搜索算法;在第 5 章中,我们将使用本节所示的方法开发出一种数据压缩算法。这些只是优先队列作为算法设计工具所起到的举足轻重的作用的一部分例子。
2.4.1 API

优先队列是一种 抽象数据类型(请见 1.2 节),它表示了一组值和对这些值的操作,它的抽象层使我们能够方便地将应用程序(用例)和我们将在本节中学习的各种具体实现隔离开来。和 1.2 节一样,我们会详细定义一组应用程序编程接口(API)来为数据结构的用例提供足够的信息(参见表 2.4.1)。优先队列最重要的操作就是 删除最大元素插入元素,所以我们会把精力集中在它们身上。删除最大元素的方法名为 delMax(),插入元素的方法名为 insert()。按照惯例,我们只会通过辅助函数 less() 来比较两个元素,和排序算法一样。如果允许重复元素, 最大 表示的是所有最大元素之一。为了将 API 定义完整,我们还需要加入构造函数(和我们在栈以及队列中使用的类似)和一个 空队列测试方法。为了保证灵活性,我们在实现中使用了泛型,将实现了 Comparable 接口的数据的类型作为参数 Key。这使得我们可以不必再区别元素和元素的键,对数据类型和算法的描述也将更加清晰和简洁。例如,我们将用“最大元素”代替“最大键值”或是“键值最大的元素”。
表 2.4.1 泛型优先队列的 API
public class  MaxPQ``              MaxPQ()创建一个优先队列              MaxPQ(int max)创建一个初始容量为 max 的优先队列              MaxPQ(Key[] a)用 a[] 中的元素创建一个优先队列         void Insert(Key v)向优先队列中插入一个元素          Key max()返回最大元素          Key delMax()删除并返回最大元素      boolean isEmpty()返回队列是否为空          int size()返回优先队列中的元素个数
为了用例代码的方便,API 包含的三个构造函数使得用例可以构造指定大小的优先队列(还可以用给定的一个数组将其初始化)。为了使用例代码更加清晰,我们会在适当的地方使用另一个类 MinPQ。它和 MaxPQ 类似,只是含有一个 delMin() 方法来删除并返回队列中键值最小的那个元素。 MaxPQ 的任意实现都能很容易地转化为 MinPQ 的实现,反之亦然,只需要改变一下 less() 比较的方向即可。
优先队列的调用示例
为了展示优先队列的抽象模型的价值,考虑以下问题:输入
1.gif
个字符串,每个字符串都对映着一个整数,你的任务就是从中找出最大的(或是最小的)
2.gif
个整数(及其关联的字符串)。这些输入可能是金融事务,你需要从中找出最大的那些;或是农产品中的杀虫剂含量,这时你需要从中找出最小的那些;或是服务请求、科学实验的结果,或是其他应用。在某些应用场景中,输入量可能非常巨大,甚至可以认为输入是无限的。解决这个问题的一种方法是将输入排序然后从中找出
3.gif
个最大的元素,但我们已经说明输入将会非常庞大。另一种方法是将每个新的输入和已知的
4.gif
个最大元素比较,但除非
5.gif
较小,否则这种比较的代价会非常高昂。只要我们能够高效地实现 insert() 和 delMin(),下面的 优先队列用例 中调用了 MinPQ 的 TopM 就能使用优先队列解决这个问题,这就是本节中我们的目标。在现代基础性计算环境中超大的输入
6.gif
非常常见,这些实现使我们能够解决以前缺乏足够资源去解决的问题,如表 2.4.2 所示。
表 2.4.2 从
7.gif
个输入中找到最大的
8.gif
个元素所需成本

示例增长的数量级时间空间排序算法的用例
9.gif
10.gif
调用初级实现的优先队列
11.gif
12.gif
调用基于堆实现的优先队列
13.gif
14.gif

一个优先队列的用例
  1. public class TopM
  2. {
  3. public static void main(String[] args)
  4. {  // 打印输入流中最大的M行
  5.    int M = Integer.parseInt(args[0]);
  6.    MinPQ<Transaction> pq = new MinPQ<Transaction>(M+1);
  7.    while (StdIn.hasNextLine())
  8.    {  // 为下一行输入创建一个元素并放入优先队列中
  9.       pq.insert(new Transaction(StdIn.readLine()));
  10.       if (pq.size() > M)
  11.       pq.delMin();        // 如果优先队列中存在M+1个元素则删除其中最小的元素
  12.    }  // 最大的M个元素都在优先队列中
  13.    Stack<Transaction> stack = new Stack<Transaction>();
  14.    while (!pq.isEmpty()) stack.push(pq.delMin());
  15.    for (Transaction t : stack) StdOut.println(t);
  16. }
  17. }
复制代码
从命令行输入一个整数
15.gif
从输入流获得一系列字符串,输入流的每一行表示一个交易。这段代码调用了 MinPQ 并会打印数字最大的
16.gif
行。它用到了 Transaction 类(请见表 1.2.6、练习 1.2.19 和练习 2.1.21),构造了一个用数字作为键的优先队列。当优先队列的大小超过
17.gif
时就删掉其中最小的元素。处理完所有交易,优先队列中存放着以增序排列的最大的 M 个交易,然后这段代码将它们放入到一个栈中,遍历这个栈以颠倒它们的顺序,从而将它们按降序打印出来。
  1. % more tinyBatch.txt
  2. Turing      6/17/1990   644.08
  3. vonNeumann  3/26/2002  4121.85
  4. Dijkstra    8/22/2007  2678.40
  5. vonNeumann  1/11/1999  4409.74
  6. Dijkstra   11/18/1995   837.42
  7. Hoare       5/10/1993  3229.27
  8. vonNeumann  2/12/1994  4732.35
  9. Hoare       8/18/1992  4381.21
  10. Turing      1/11/2002    66.10
  11. Thompson    2/27/2000  4747.08
  12. Turing      2/11/1991  2156.86
  13. Hoare       8/12/2003  1025.70
  14. vonNeumann 10/13/1993  2520.97
  15. Dijkstra    9/10/2000   708.95
  16. Turing     10/12/1993  3532.36
  17. Hoare       2/10/2005  4050.20
复制代码
  1. % java TopM 5 < tinyBatch.txt
  2. Thompson    2/27/2000  4747.08
  3. vonNeumann  2/12/1994  4732.35
  4. vonNeumann  1/11/1999  4409.74
  5. Hoare       8/18/1992  4381.21
  6. vonNeumann  3/26/2002  4121.85
复制代码
2.4.2 初级实现

我们在第 1 章中讨论过的 4 种基础数据结构是实现优先队列的起点。我们可以使用有序或无序的数组或链表。在队列较小时,大量使用两种主要操作之一时,或是所操作元素的顺序已知时,它们十分有用。因为这些实现相对简单,我们在这里只给出文字描述并将实现代码作为练习(请见练习 2.4.3)。
2.4.2.1 数组实现(无序)

或许实现优先队列的最简单方法就是基于 2.1 节中下压栈的代码。 insert() 方法的代码和栈的 push() 方法完全一样。要实现删除最大元素,我们可以添加一段类似于选择排序的内循环的代码,将最大元素和边界元素交换然后删除它,和我们对栈的 pop() 方法的实现一样。和栈类似,我们也可以加入调整数组大小的代码来保证数据结构中至少含有四分之一的元素而又永远不会溢出。
2.4.2.2 数组实现(有序)

另一种方法就是在 insert() 方法中添加代码,将所有较大的元素向右边移动一格以使数组保持有序(和插入排序一样)。这样,最大的元素总会在数组的一边,优先队列的 删除最大元素操作 就和栈的 pop() 操作一样了。
2.4.2.3 链表表示法

和刚才类似,我们可以用基于链表的下压栈的代码作为基础,而后可以选择修改 pop() 来找到并返回最大元素,或是修改 push() 来保证所有元素为 逆序 并用 pop() 来删除并返回链表的首元素(也就是最大的元素)。
使用无序序列是解决这个问题的 惰性 方法,我们仅在必要的时候才会采取行动(找出最大元素);使用有序序列则是解决问题的 积极 方法,因为我们会尽可能未雨绸缪(在插入元素时就保持列表有序),使后续操作更高效。
实现栈或是队列与实现优先队列的最大不同在于对性能的要求。对于栈和队列,我们的实现能够在 常数 时间内完成所有操作;而对于优先队列,我们刚刚讨论过的所有初级实现中, 插入元素删除最大元素 这两个操作之一在最坏情况下需要 线性 时间来完成(如表 2.4.3 所示)。我们接下来要讨论的基于数据结构 的实现能够保证这两种操作都能更快地执行。
表 2.4.3 优先队列的各种实现在最坏情况下运行时间的增长数量级
数据结构
插入元素
删除最大元素
有序数组
18.gif

1
无序数组
1
19.gif


20.gif

21.gif

理想情况
1
1
在一个优先队列上执行的一系列操作如表 2.4.4 所示。
表 2.4.4 在一个优先队列上执行的一系列操作
操作
参数
返回值
大小
内容(无序)
内容(有序)
插入元素
P
1
P
P
插入元素
Q
2
P  Q
P  Q
插入元素
E
3
P  Q  E
E  P  Q
删除最大元素
Q
2
P  E
E  P
插入元素
X
3
P  E  X
E  P  X
插入元素
A
4
P  E  X  A
A  E  P  X
插入元素
M
5
P  E  X  A  M
A  E  M  P  X
删除最大元素
X
4
P  E  M  A
A E  M  P
插入元素
P
5
P  E  M  A  P
A  E  M  P  P
插入元素
L
6
P  E  M  A  P  L
A  E  L  M  P  P
插入元素
E
7
P  E  M  A  P  L  E
A  E  E  L  M  P  P
删除最大元素
P
6
E  E  M  A  P  L
A  E  E  L  M  P
2.4.3 堆的定义

数据结构 二叉堆 能够很好地实现优先队列的基本操作。在二叉堆的数组中,每个元素都要保证大于等于另两个特定位置的元素。相应地,这些位置的元素又至少要大于等于数组中的另两个元素,以此类推。如果我们将所有元素画成一棵二叉树,将每个较大元素和两个较小的元素用边连接就可以很容易看出这种结构。
定义。当一棵二叉树的每个结点都大于等于它的两个子结点时,它被称为 堆有序
相应地,在堆有序的二叉树中,每个结点都小于等于它的父结点(如果有的话)。从任意结点向上,我们都能得到一列非递减的元素;从任意结点向下,我们都能得到一列非递增的元素。特别地:
命题 O。根结点是堆有序的二叉树中的最大结点。
证明。根据树的性质归纳可得。
二叉堆表示法
如果我们用指针来表示堆有序的二叉树,那么每个元素都需要三个指针来找到它的上下结点(父结点和两个子结点各需要一个)。但如图 2.4.1 所示,如果我们使用完全二叉树,表达就会变得特别方便。要画出这样一棵完全二叉树,可以先定下根结点,然后一层一层地由上向下、从左至右,在每个结点的下方连接两个更小的结点,直至将
22.gif
个结点全部连接完毕。完全二叉树只用数组而不需要指针就可以表示。具体方法就是将二叉树的结点按照 层级顺序 放入数组中,根结点在位置 1,它的子结点在位置 2 和 3,而子结点的子结点则分别在位置 4、5、6 和 7,以此类推。
23.gif

图 2.4.1 一棵堆有序的完全二叉树
定义二叉堆 是一组能够用堆有序的完全二叉树排序的元素,并在数组中按照层级储存(不使用数组的第一个位置)。
(简单起见,在下文中我们将 二叉堆 简称为 )在一个堆中,位置
24.gif
的结点的父结点的位置为
25.gif
,而它的两个子结点的位置则分别为
26.gif
27.gif
。这样在不使用指针的情况下(我们在第 3 章中讨论二叉树时会用到它们)我们也可以通过计算数组的索引在树中上下移动:从 a[k] 向上一层就令 k 等于 k/2,向下一层则令 k 等于 2k 或 2k+1。
用数组(堆)实现的完全二叉树的结构是很严格的,但它的灵活性已经足以让我们高效地实现优先队列。用它们我们将能实现对数级别的 插入元素删除最大元素 的操作。利用在数组中无需指针即可沿树上下移动的便利和以下性质,算法保证了对数复杂度的性能。
命题 P。一棵大小为
28.gif
的完全二叉树的高度为
29.gif

证明。通过归纳很容易可以证明这一点,且当
30.gif
达到 2 的幂时树的高度会加 1。
图 2.4.2 堆的表示
2.4.4 堆的算法

我们用长度为
31.gif
的私有数组 pq[] 来表示一个大小为
32.gif
的堆,我们不会使用 pq[0],堆元素放在 pq[1] 至 pq[N] 中。在排序算法中,我们只通过私有辅助函数 less() 和 exch() 来访问元素,但因为所有的元素都在数组 pq[] 中,我们在 2.4.4.2 节中会使用更加紧凑的实现方式,不再将数组作为参数传递。堆的操作会首先进行一些简单的改动,打破堆的状态,然后再遍历堆并按照要求将堆的状态恢复。我们称这个过程叫做 堆的有序化(reheapifying)。
  1. private boolean less(int i, int j)
  2. {  return pq[i].compareTo(pq[j]) < 0;  }
  3. private void exch(int i, int j)
  4. {  Key t = pq[i]; pq[i] = pq[j]; pq[j] = t;  }
复制代码
堆实现的比较和交换方法
堆实现的比较和交换方法如右上方的代码框所示。
在有序化的过程中我们会遇到两种情况。当某个结点的优先级上升(或是在堆底加入一个新的元素)时,我们需要 由下至上 恢复堆的顺序。当某个结点的优先级下降(例如,将根结点替换为一个较小的元素)时,我们需要 由上至下 恢复堆的顺序。首先,我们会学习如何实现这两种辅助操作,然后再用它们实现 插入元素删除最大元素 的操作。
2.4.4.1 由下至上的堆有序化(上浮)
  1. private void swim(int k)
  2. {
  3.    while (k > 1 && less(k/2, k))
  4.    {
  5.       exch(k/2, k);
  6.       k = k/2;
  7.    }
  8. }
复制代码
由下至上的堆有序化(上浮)的实现
如果堆的有序状态因为某个结点变得比它的父结点更大而被打破,那么我们就需要通过交换它和它的父结点来修复堆。交换后,这个结点比它的两个子结点都大(一个是曾经的父结点,另一个比它更小,因为它是曾经父结点的子结点),但这个结点仍然可能比它现在的父结点更大。我们可以一遍遍地用同样的办法恢复秩序,将这个结点不断向上移动直到我们遇到了一个更大的父结点。只要记住位置
33.gif
的结点的父结点的位置是
34.gif
,这个过程实现起来很简单。 swim() 方法中的循环可以保证只有位置
35.gif
上的结点大于它的父结点时堆的有序状态才会被打破。因此只要该结点不再大于它的父结点,堆的有序状态就恢复了。至于方法名,当一个结点太大的时候它需要 (swim)到堆的更高层。由下至上的堆有序化的实现代码如右上方所示。
图 2.4.3 由下至上的堆有序化(上浮)
2.4.4.2 由上至下的堆有序化(下沉)

如果堆的有序状态因为某个结点变得比它的两个子结点或是其中之一更小了而被打破了,那么我们可以通过将它和它的两个子结点中的较大者交换来恢复堆。交换可能会在子结点处继续打破堆的有序状态,因此我们需要不断地用相同的方式将其修复,将结点向下移动直到它的子结点都比它更小或是到达了堆的底部。由位置为
36.gif
的结点的子结点位于
37.gif
38.gif
可以直接得到对应的代码。至于方法名,由上至下的堆有序化的示意图及实现代码分别见图 2.4.4 和下页的代码框。当一个结点太小的时候它需要 (sink)到堆的更低层。
图 2.4.4 由上至下的堆有序化(下沉)
如果我们把堆想象成一个严密的黑社会组织,每个子结点都表示一个下属(父结点则表示它的直接上级),那么这些操作就可以得到很有趣的解释。 swim() 表示一个很有能力的新人加入组织并被逐级提升(将能力不够的上级踩在脚下),直到他遇到了一个更强的领导。 sink() 则类似于整个社团的领导退休并被外来者取代之后,如果他的下属比他更厉害,他们的角色就会交换,这种交换会持续下去直到他的能力比其下属都强为止。这些理想化的情景在现实生活中可能很罕见,但它们能够帮助你理解堆的这些基本行为。
sink() 和 swim() 方法是高效实现优先队列 API 的基础,原因如下(具体的实现请见算法 2.6)。
  1. private void sink(int k)
  2. {
  3.    while (2*k <= N)
  4.    {
  5.       int j = 2*k;
  6.       if (j < N && less(j, j+1)) j++;
  7.       if (!less(k, j)) break;
  8.       exch(k, j);
  9.       k = j;
  10.    }
  11. }
复制代码
这段代码用 sink() 方法将 a[1] 到 a[N] 的元素排序( sink() 被修改过,以 a[] 和 N 作为参数)。 for 循环构造了堆,然后 while 循环将最大的元素 a[1] 和 a[N] 交换并修复了堆,如此重复直到堆变空。将 exch() 和 less() 的实现中的索引减一即可得到和其他排序算法一致的实现(将 a[0] 至 a[N-1] 排序)。
**堆排序的轨迹(每次下沉后的数组内容)
</blockquote>图 2.4.7 堆排序:堆的构造(左)和下沉排序(右)
2.4.5.2 下沉排序

堆排序的主要工作都是在第二阶段完成的。这里我们将堆中的最大元素删除,然后放入堆缩小后数组中空出的位置。这个过程和选择排序有些类似(按照降序而非升序取出所有元素),但所需的比较要少得多,因为堆提供了一种从未排序部分找到最大元素的有效方法。
命题 S。将
39.gif
个元素排序,堆排序只需少于(
40.gif
)次比较(以及一半次数的交换)。
证明
41.gif
项来自于堆的构造(见命题 R)。
42.gif
项来自于每次下沉操作最大可能需要
43.gif
次比较(见命题 P 与命题 Q)。
算法 2.7 完整地实现了这些思想,也就是经典的 堆排序 算法。它的发明人是 J. W. J. Williams,并由 R. W. Floyd 在 1964 年改进。尽管这段程序中循环的任务各不同(第一段循环构造堆,第二段循环在下沉排序中销毁堆),它们都是基于 sink() 方法。我们将该实现和优先队列的 API 独立开来是为了突出这个排序算法的简洁性( sort() 方法只需 8 行代码, sink() 函数 8 行),并使其可以嵌入其他代码之中。
和以前一样,通过研究可视轨迹(如图 2.4.8 所示)我们可以深入了解算法的操作。一开始算法的行为似乎杂乱无章,因为随着堆的构建较大的元素都被移动到了数组的开头,但接下来算法的行为看起来就和选择排序一模一样了(除了它比较的次数少得多)。
图 2.4.8 堆排序的可视轨迹
和我们学过的其他算法一样,很多人都研究过许多改进基于堆的优先队列的实现和堆排序的方法。我们这里简要地看看其中之一。
2.4.5.3 先下沉后上浮

大多数在下沉排序期间重新插入堆的元素会被直接加入到堆底。Floyd 在 1964 年观察发现,我们正好可以通过免去检查元素是否到达正确位置来节省时间。在下沉中总是直接提升较大的子结点直至到达堆底,然后再使元素上浮到正确的位置。这个想法几乎可以将比较次数减少一半——接近了归并排序所需的比较次数(随机数组)。这种方法需要额外的空间,因此在实际应用中只有当比较操作代价较高时才有用(例如,当我们在将字符串或者其他键值较长类型的元素进行排序时)。
堆排序在排序复杂性的研究中有着重要的地位,因为它是我们所知的唯一能够同时最优地利用空间和时间的方法——在最坏的情况下它也能保证使用
44.gif
次比较和恒定的额外空间。当空间十分紧张的时候(例如在嵌入式系统或低成本的移动设备中)它很流行,因为它只用几行就能实现(甚至机器码也是)较好的性能。但现代系统的许多应用很少使用它,因为它无法利用缓存。数组元素很少和相邻的其他元素进行比较,因此缓存未命中的次数要远远高于大多数比较都在相邻元素间进行的算法,如快速排序、归并排序,甚至是希尔排序。
另一方面,用堆实现的优先队列在现代应用程序中越来越重要,因为它能在 插入操作删除最大元素操作 混合的动态场景中保证对数级别的运行时间。我们会在本书后续章节见到更多的例子。
答疑

 我还是不明白优先队列是做什么用的。为什么我们不直接把元素排序然后再一个个地引用有序数组中的元素?
 在某些数据处理的例子里,比如 TopM 和 Multiway,总数据量太大,无法排序(甚至无法全部装进内存)。如果你需要从 10 亿个元素中选出最大的十个,你真的想把一个 10 亿规模的数组排序吗?但有了优先队列,你就只用一个能存储十个元素的队列即可。在其他的例子中,我们甚至无法同时获取所有的数据,因此只能先从优先队列中取出并处理一部分,然后再根据结果决定是否向优先队列中添加更多的数据。
 为什么不像我们在其他排序算法中那样使用 Comparable 接口,而在 MaxPQ 中使用泛型的 Item 呢?
 这么做的话 delMax() 的用例就需要将返回值转换为某种具体的类型,比如 String。一般来说,应该尽量避免在用例中进行类型转换。
 为什么在堆的表示中不使用 a[0] ?
 这么做可以稍稍简化计算。实现从 0 开始的堆并不困难, a[0] 的子结点是 a[1] 和 a[2], a[1] 的子结点是 a[3] 和 a[4], a[2] 的子结点是 a[5] 和 a[6],以此类推。但大多数程序员更喜欢我们的简单方法。另外,将 a[0] 的值用作哨兵(作为 a[1] 的父结点)在某些堆的应用中很有用。
 在我看来,在堆排序中构造堆时,逐个向堆中添加元素比 2.4.5.1 节中描述的由底向上的复杂方法更简单。为什么要这么做?
 对于一个排序算法来说,这么做能够快上 20%,而且所需的代码更少(不会用到 swim() 函数)。理解算法的难度并不一定与它的简洁性或者效率相关。
 如果我去掉 MaxPQ 的实现中的 extends Comparable 这句话会怎样?
 和以前一样,回答这类问题的最简单的办法就是你自己直接试试。如果这么做 MaxPQ 会报出一个编译错误:
  1. public class MaxPQ<Key extends Comparable<Key>>
  2. {
  3. private Key[] pq;             // 基于堆的完全按二叉树
  4. private int N = 0;            // 存储于pq[1..N]中,pq[0]没有使用
  5. public MaxPQ(int maxN)
  6. {  pq = (Key[]) new Comparable[maxN+1];  }
  7. public boolean isEmpty()
  8. {  return N == 0;  }
  9. public int size()
  10. {  return N;  }
  11. public void insert(Key v)
  12. {
  13.    pq[++N] = v;
  14.    swim(N);
  15. }
  16. public Key delMax()
  17. {
  18.    Key max = pq[1];           // 从根结点得到最大元素
  19.    exch(1, N--);              // 将其和最后一个结点交换
  20.    pq[N+1] = null;            // 防止对象游离
  21.    sink(1);                   // 恢复堆的有序性
  22.    return max;
  23. }
  24. // 辅助方法的实现请见本节前面的代码框
  25. private boolean less(int i, int j)
  26. private void exch(int i, int j)
  27. private void swim(int k)
  28. private void sink(int k)
  29. }
复制代码
Java 这样告诉你它不知道 Item 对象的 compareTo() 方法,因为你没有声明 Item extends Comparable。
练习

2.4.1 用序列 P R I O * R * * I * T * Y * * * Q U E * * * U * E (字母表示 插入元 素,星号表示 删除最大元素)操作一个初始为空的优先队列。给出每次 删除最大元素 返回的字符。
2.4.2 分析以下说法:要实现在常数时间找到 最大元素,为何不用一个栈或队列,然后记录已插入的最大元素并在找出最大元素时返回它的值?
2.4.3 用以下数据结构实现优先队列,支持 插入元素删除最大元素 的操作:无序数组、有序数组、无序链表和链表。将你的 4 种实现中每种操作在最坏情况下的运行时间上下限制成一张表格。
2.4.4 一个按降序排列的数组也是一个面向最大元素的堆吗?
2.4.5 将 E A S Y Q U E S T I O N 顺序插入一个面向最大元素的堆中,给出结果。
2.4.6 按照练习 2.4.1 的规则,用序列 P R I O * R * * I * T * Y * * * Q U E * * * U * E 操作一个初始为空的面向最大元素的堆,给出每次操作后堆的内容。
2.4.7 在堆中,最大的元素一定在位置 1 上,第二大的元素一定在位置 2 或者 3 上。对于一个大小为 31 的堆,给出第
45.gif
大的元素可能出现的位置和不可能出现的位置,其中
46.gif
、3、4(设元素值不重复)。
2.4.8 回答上一道练习中第
47.gif
元素的可能和不可能的位置。
2.4.9 给出 A B C D E 五个元素可能构造出来的所有堆,然后给出 A A A B B 这五个元素可能构造出来的所有堆。
2.4.10 假设我们不想浪费堆有序的数组 pq[] 中的那个位置,将最大的元素放在 pq[0],它的子结点放在 pq[1] 和 pq[2],以此类推。 pq[k] 的父结点和子结点在哪里?
2.4.11 如果你的应用中有大量的 插入元素 的操作,但只有若干 删除最大元素 操作,哪种优先队列的实现方法更有效:堆、无序数组、有序数组?
2.4.12 如果你的应用场景中大量的找出 最大元素 的操作,但 插入元素删除最大元素 操作相对较少,哪种优先队列的实现方法更有效:堆、无序数组、有序数组?
2.4.13 想办法在 sink() 中避免检查 j < N。
2.4.14 对于没有重复元素的大小为
48.gif
的堆,一次删除最大元素的操作中最少要交换几个元素?构造一个能够达到这个交换次数的大小为 15 的堆。连续两次 删除最大元素 呢?三次呢?
2.4.15 设计一个程序,在线性时间内检测数组 pq[] 是否是一个面向最小元素的堆。
2.4.16 对于
49.gif
,构造数组使得堆排序使用的比较次数最多以及最少。
2.4.17 证明:构造大小为
50.gif
的面向最小元素的优先队列,然后进行
51.gif
次替换最小元素操作( 删除最小元素 后再 插入元素)后,
52.gif
个元素中的前
53.gif
大元素均会留在优先队列中。
2.4.18 在 MaxPQ 中,如果一个用例使用 insert() 插入了一个比队列中的所有元素都大的新元素,随后立即调用 delMax()。假设没有重复元素,此时的堆和进行这些操作之前的堆完全相同吗?进行两次 insert()(第一次插入一个比队列所有元素都大的元素,第二次插入一个更大的元素)操作接两次 delMax() 操作呢?
2.4.19 实现 MaxPQ 的一个构造函数,接受一个数组作为参数。使用正文 2.4.5.1 节中所述的自底向上的方法构造堆。
2.4.20 证明:基于下沉的堆构造方法使用的比较次数小于
54.gif
,交换次数小于
55.gif

提高题

2.4.21 基础数据结构。说明如何使用优先队列实现第 1 章中的栈、队列和随机队列这几种数据结构。
2.4.22 调整数组大小。在 MaxPQ 中加入调整数组大小的代码,并和命题 Q 一样证明对于一般性长度为
56.gif
的队列其数组访问的上限。
2.4.23 Multiway 的堆。只考虑比较的成本且假设找到
57.gif
个元素中的最大者需要
58.gif
次比较,在堆排序中使用
59.gif
向堆的情况下找出使比较次数
60.gif
的系数最小的
61.gif
值。首先,假设使用的是一个简单通用的 sink() 方法;其次,假设 Floyd 方法在内循环中每轮可以节省一次比较。
2.4.24 使用链接的优先队列。用堆有序的二叉树实现一个优先队列,但使用链表结构代替数组。每个结点都需要三个链接:两个向下,一个向上。你的实现即使在无法预知队列大小的情况下也能保证优先队列的基本操作所需的时间为对数级别。
2.4.25 计算数论。编写程序 CubeSum.java,在不使用额外空间的条件下,按大小顺序打印所有
62.gif
的结果,其中
63.gif
64.gif
为 0 至
65.gif
之间的整数。也就是说,不要全部计算
66.gif
个和然后排序,而是创建一个最小优先队列,初始状态为
67.gif
。这样只要优先队列非空,删除并打印最小的元素
68.gif
。然后如果 69.gif ,插入元素
70.gif
。用这段程序找出 0 到
71.gif
之间所有满足
72.gif
的不同整数 a,b,c,d。
2.4.26 无需交换的堆。因为 sink() 和 swim() 中都用到了初级函数 exch(),所以所有元素都被多加载并存储了一次。回避这种低效方式,用插入排序给出新的实现(请见练习 2.1.25)。
2.4.27 找出最小元素。在 MaxPQ 中加入一个 min() 方法。你的实现所需的时间和空间都应该是常数。
2.4.28 选择过滤。编写一个 TopM 的用例,从标准输入读入坐标
73.gif
,从命令行得到值
74.gif
,然后打印出距离原点的欧几里得距离最小的
75.gif
个点。在
76.gif
77.gif
时,预计程序的运行时间。
2.4.29 同时面向最大和最小元素的优先队列。设计一个数据类型,支持如下操作: 插入元素删除最大元素删除最小元素(所需时间均为对数级别),以及 找到最大元素找到最小元素(所需时间均为常数级别)。 提示:用两个堆。
2.4.30 动态中位数查找。设计一个数据类型,支持在对数时间内插入元素,常数时间内 找到中位数 并在对数时间内 删除中位数提示:用一个面向最大元素的堆再用一个面向最小元素的堆。
2.4.31 快速插入。用基于比较的方式实现 MinPQ 的 API,使得插入元素需要
78.gif
次比较,删除最小元素需要
79.gif
次比较。 提示:在 swim() 方法中用二分查找来寻找祖先结点。
2.4.32 下界。请证明,不存在一个基于比较的对 MinPQ 的 API 的实现能够使得 插入元素删除最小元素 的操作都保证只使用
80.gif
次比较。
2.4.33 索引优先队列的实现。按照 2.4.4.6 节的描述修改算法 2.6 来实现索引优先队列 API 中的基本操作:
使用 pq[] 保存索引,添加一个数组 keys[] 来保存元素,再添加一个数组 qp[] 来保存 pq[] 的逆序—— qp 的值是 i 在 pq[] 中的位置(即索引 j, pq[j]=i)。修改算法 2.6 的代码来维护这些数据结构。若 i 不在队列之中,则总是令 qp = -1 并添加一个方法 contains() 来检测这种情况。你需要修改辅助函数 exch() 和 less(),但不需要修改 sink() 和 swim()。
2.4.34 索引优先队列的实现(附加操作)。向练习 2.4.33 的实现中添加 minIndex()、 change() 和 delete() 方法。
解答
  1. public class Multiway
  2. {
  3. public static void merge(In[] streams)
  4. {
  5.    int N = streams.length;
  6.    IndexMinPQ<String> pq = new IndexMinPQ<String>(N);
  7.    for (int i = 0; i < N; i++)
  8.       if (!streams[i].isEmpty())
  9.           pq.insert(i, streams[i].readString());
  10.    while (!pq.isEmpty())
  11.    {
  12.       StdOut.println(pq.min());
  13.       int i = pq.delMin();
  14.       if (!streams[i].isEmpty())
  15.           pq.insert(i, streams[i].readString());
  16.    }
  17. }
  18. public static void main(String[] args)
  19. {
  20.   int N = args.length;
  21.   In[] streams = new In[N];
  22.   for (int i = 0; i < N; i++)
  23.       streams[i] = new In(args[i]);
  24.   merge(streams);
  25. }
  26. }
复制代码
2.4.35 离散概率分布的取样。编写一个 Sample 类,其构造函数接受一个 double 类型的数组 p[] 作为参数并支持以下操作: random()——返回任意索引 i 及其概率 p/T( T 是 p[] 中所有元素之和); change(i, v)——将 p 的值修改为 v。 提示:使用完全二叉树,每个结点对应一个权重 p。在每个结点记录其下子树的权重之和。为了产生一个随机的索引,取 0 到 T 之间的一个随机数并根据各个结点的权重之和来判断沿着哪条子树搜索下去。在更新 p 时,同时更新从根结点到 i 的路径上的所有结点。不要像堆的实现那样显式使用指针。
实验题

2.4.36 性能测试 I。编写一个性能测试用例,用 插入元素 操作填满一个优先队列,然后用 删除最大元素 操作删去一半元素,再用 插入元素 操作填满优先队列,再用 删除最大元素 操作删去所有元素。用一列随机的长短不同的元素多次重复以上过程,测量每次运行的用时,打印平均用时或是将其绘制成图表。
2.4.37 性能测试 II。编写一个性能测试用例,用 插入元素 操作填满一个优先队列,然后在一秒钟之内尽可能多地连续反复调用 删除最大元素插入元素 的操作。用一列随机的长短不同的元素多次重复以上过程,将程序能够完成的 删除最大元素 操作的平均次数打印出来或是绘成图表。
2.4.38 练习测试。编写一个练习用例,用算法 2.6 中实现的优先队列的接口方法处理实际应用中可能出现的高难度或是极端情况。例如,元素已经有序、元素全部逆序、元素全部相同或是所有元素只有两个值。
2.4.39 构造函数的代价。对于
81.gif
82.gif
83.gif
,根据经验判断堆排序时构造堆占总耗时的比例。
2.4.40 Floyd 方法。根据正文中 Floyd 的先沉后浮思想实现堆排序。对于
84.gif
85.gif
86.gif
大小的随机不重复数组,记录你的程序所使用的比较次数和标准实现所使用的比较次数。
2.4.41 Multiway 堆。根据正文中的描述实现基于完全堆有序的三叉树和四叉树的堆排序。对于
87.gif
88.gif
89.gif
大小的随机不重复数组,记录你的程序所使用的比较次数和标准实现所使用的比较次数。
2.4.42 堆的前序表示。用前序法而非级别表示一棵堆有序的树,并基于此实现堆排序。对于
90.gif
91.gif
92.gif
大小的随机不重复数组,记录你的程序所使用的比较次数和标准实现所使用的比较次数。
本文由博客一文多发平台 OpenWrite 发布!

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册