[关闭]
@c102zkl 2018-08-28T10:51:34.000000Z 字数 2378 阅读 543

hashSet 如何保证元素不重复的?

面试 Java基础


HashSet类中的add()源码

  1. public boolean add(E e) {
  2. return map.put(e, PRESENT)==null;
  3. }

类中map和PARENT的定义:

  1. private transient HashMap<E,Object> map;
  2. // Dummy value to associate with an Object in the backing Map
  3. private static final Object PRESENT = new Object(); // 个人认为这是一个占位值,保证不为Null

HashMap的key是不能重复的,而这里HashSet的元素又是作为了map的key,当然也不能重复了。
以下是HashMap如何保证key值不重复的代码

  1. final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
  2. boolean evict) {
  3. Node<K,V>[] tab; //缓存底层数组用,都是指向一个地址的引用
  4. Node<K,V> p; //插入数组的桶i处的键值对节点
  5. int n; //底层数组的长度
  6. int i; //插入数组的桶的下标
  7. //刚开始table是null或空的时候,初始化个默认的table;为tab和n赋值,tab指向底层数组,n为底层数组的长度
  8. if ((tab = table) == null || (n = tab.length) == 0)
  9. n = (tab = resize()).length;
  10. //(n - 1) & hash:根据hash值算出插入点在底层数组的桶的位置,即下标值;为p赋值,也为i赋值(不管碰撞与否,都已经赋值了)
  11. //如果在数组上,没有发生碰撞,即当前要插入的位置上之前没有插入过值,则直接在此位置插入要插入的键值对
  12. if ((p = tab[i = (n - 1) & hash]) == null)
  13. tab[i] = newNode(hash, key, value, null);//插入的节点的next属性是null
  14. else { //发生碰撞,即当前位置已经插入了值
  15. Node<K,V> e; K k;//中间变量吧,跟冒泡排序里面的那个中间变量似的,起到个值交换的作用
  16. //hash值相同,key也相同,那么就是更新这个键值对的值。同 jdk 1.7
  17. if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
  18. e = p;
  19. else if (p instanceof TreeNode)
  20. //jdk 1.8引入了红黑树来处理碰撞,上面判断p的类型已经是树结构了,
  21. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);//如果是,则走添加树的方法。
  22. else {
  23. for (int binCount = 0; ; ++binCount) { //还未形成树结构,还是jdk 1.7的链表结构
  24. //差别就是1.7:是头插法,后来的留在数组上,先来的链在尾上;1.8:是先来的就留在数组上,后来的链在尾上
  25. //判断p.next是否为空,同时为e赋值,若为空,则p.next指向新添加的节点,这是在链表长度小于7的时候
  26. if ((e = p.next) == null) {
  27. p.next = newNode(hash, key, value, null);
  28. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  29. treeifyBin(tab, hash);
  30. break;
  31. }
  32. //如果在循环链表的时候,找到key相同的节点,那么就跳出循环,就走不到链表的尾上了。
  33. if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
  34. break;
  35. //这个就是p.next也就是e不为空,然后,还没有key相同的情况出现,那就继续循环链表,
  36. // p指向p.next也就是e,继续循环,继续,e=p.next
  37. p = e;
  38. //直到p.next为空,添加新的节点;或者出现key相等,更新旧值的情况才跳出循环。
  39. }
  40. }
  41. //经过上面if else if else之后,e在新建节点的时候,为null;更新的时候,则被赋值。
  42. if (e != null) { // existing mapping for key
  43. V oldValue = e.value;
  44. //onlyIfAbsent 这个在调用hashMap的put()的时候,一直是false,那么下面更新value是肯定执行的
  45. if (!onlyIfAbsent || oldValue == null)
  46. e.value = value;
  47. afterNodeAccess(e);
  48. return oldValue;
  49. }
  50. }
  51. ++modCount;
  52. if (++size > threshold)
  53. resize();
  54. afterNodeInsertion(evict);
  55. return null;
  56. }

其中最关键的一句:

  1. if (e.hash == hash && ((k = e.key) == key || key.equals(k)))

调用了对象的hashCodeequals方法进行的判断,


首先要明确:只通过hash码值来判断两个对象时否相同合适吗?答案是不合适的,因为有可能两个不同的对象的hash码值相同;

什么是hash码值?

在java中存在一种hash表结构,它通过一个算法,计算出的结果就是hash码值;这个算法叫hash算法;
hash算法是怎么计算的呢?
是通过对象中的成员来计算出来的结果;
如果成员变量是基本数据类型的值, 那么用这个值 直接参与计算;
如果成员变量是引用数据类型的值,那么获取到这个成员变量的哈希码值后,再参数计算

所以又得出一个结论:若要将对象存放到HashSet中并保证对象不重复,应根据实际情况将对象的hashCode方法和equals方法进行重写

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注