20201020 模拟散列表(hash)

it2023-07-07 117

文章目录

题目拉链法算法说明变量定义源代码经验总结开放寻址法算法说明变量定义源代码代码说明

题目

维护一个集合，支持如下几种操作： “I x”，插入一个数x； “Q x”，询问数x是否在集合中出现过；现在要进行N次操作，对于每个询问操作输出对应的结果。输入格式第一行包含整数N，表示操作数量。接下来N行，每行包含一个操作指令，操作指令为”I x”，”Q x”中的一种。输出格式对于每个询问指令“Q x”，输出一个询问结果，如果x在集合中出现过，则输出“Yes”，否则输出“No”。每个结果占一行。数据范围 1≤N≤105 −109≤x≤109

输入样例：

5 I 1 I 2 I 3 Q 2 Q 5

输出样例：

Yes No

拉链法算法说明

拉链法算法是散列表的经典算法之一.首先明确,散列表(hash表)到底是如何存储/查找数据的. 本质上来说,散列表是将一个大的空间通过某种算法映射到一个小的空间,这样在查找时,可以快速的找到目标,相当于为每一个人单独定了一个房间,只要给出名字立马就可以找到对应的房间,而不用一个个遍历. 就好比刘一住在"刘氏房间",李二住在"李氏房间"等等,想找刘一直接去刘氏房间即可,不用挨个房间走寻找了.如果有多个姓刘的呢?那么他们一定会都住在刘氏房间,我们只要在刘氏房间,按照链表的形式就能找到了. 这个,就是拉链法的思想.

变量定义

拉链法需要定义以下几个变量(以后的算法文章都要列出此算法需要定义哪些变量,含义是什么)

h[]:代表"房间",真正的含义是链表的头指针,因此我们将英文定为h,并初始化为0e[index]:代表index结点的值ne[index]:代表index结点的下一结点的指针index:代表结点的编号,新建结点的编号从1开始,这样头指针指向0就表示没有任何的结点. e[index]如同之前的链表的含义,新节点的出现就是此数组的新索引的赋值.

源代码

import java.util.*; class Main{ static int N=100010; static int index; //static int NULL=0x3f3f3f; static int[] e=new int[N]; //存储链表的值 static int[] ne=new int[N]; //存储链表节点的下一指针 static int[] h=new int[N];//此数组存的其实是每个链表的头指针 public static void main(String[] args){ int index=0;//当前指针 Scanner sc=new Scanner(System.in); /*for(int i=0;i<N;i++){ h[i]=NULL; }*/ int n=sc.nextInt(); sc.nextLine(); while(n-->0){ String[] s=sc.nextLine().split(" "); if("I".equals(s[0])){ int x=Integer.parseInt(s[1]); insert(x); } else{ int x=Integer.parseInt(s[1]); String res=seek(x); System.out.println(res); } } } //插入 public static void insert(int x){ int k=change2hash(x); index++; e[index]=x; ne[index]=h[k]; h[k]=index; } //寻找 public static String seek(int x){ int k=change2hash(x); int idx=h[k]; while(idx!=0){ if(e[idx]==x) return "Yes"; else idx=ne[idx]; } return "No"; } //hash值变换 public static int change2hash(int x){ return (x%N+N)%N; } }

经验总结

由于java不存在指针传递,因此为了让值通过函数修改,我们需要让变量设为static,这样就绕过了传入形参的过程,我们也无需思考传入形参的过程,直接对变量本身进行修改.

开放寻址法算法说明

开放寻址法和拉链法都是在给出目标时,可以立马将大的搜索域变为小的搜索域.不同的是,开放寻址法没有使用纵向链表结构,而是使用横向的继续搜索方式.在定位位置没有找到则会继续跳向下一个位置,直到搜索到或者遍历一遍为止.搜索存在的元素速度会很快(搜索没有的元素会遍历所有)

变量定义

h[k]:存储k位置的值(直接就是值了)NULL:因为数组存储的直接就是值,而在插入/寻找时要确定当前位置有没有被插入过,此时未插入的值就不能像头结点那个选为-1或者0了,因为很可能插入的就是-1/0,为防止此情况,选用值范围外的数字定位NULL,并在数组初始化时全部初始化为NULL

源代码

import java.util.*; class Main{ static int N=100010; static int index; static int NULL=0x3f3f3f; static int[] h=new int[N];//此数组存的其实是每个链表的头指针 public static void main(String[] args){ Scanner sc=new Scanner(System.in); for(int i=0;i<N;i++){ h[i]=NULL; } int n=sc.nextInt(); sc.nextLine(); while(n-->0){ String[] s=sc.nextLine().split(" "); if("I".equals(s[0])){ int x=Integer.parseInt(s[1]); int k=find(x); h[k]=x; } else{ int x=Integer.parseInt(s[1]); int k=find(x); String s1; if(h[k]==x) s1="Yes"; else s1="No"; System.out.println(s1); } } } //返回这个x应该存储的位置 public static int find(int x){ int k=(x%N+N)%N; while(h[k]!=NULL&&h[k]!=x){ k++; if(k==N){ k=0; } } return k; } }

代码说明

对于此代码,最重要的是find函数,表示的含义是数值x应该存储的位置,这样插入时在此位置插入,寻找时在此位置寻找即可. 另外值得注意的是,开放寻址的数组范围一般会是数的3倍,因此不会存在无限循环查找的情况了. 也就是不需要担心

while(h[k]!=NULL&&h[k]!=x){ k++; if(k==N){ k=0; } }

会死循环

最新回复(0)