@c102zkl
2018-08-28T10:51:34.000000Z
字数 2378
阅读 566
面试 Java基础
HashSet类中的add()源码
public boolean add(E e) {return map.put(e, PRESENT)==null;}
类中map和PARENT的定义:
private transient HashMap<E,Object> map;// Dummy value to associate with an Object in the backing Mapprivate static final Object PRESENT = new Object(); // 个人认为这是一个占位值,保证不为Null
HashMap的key是不能重复的,而这里HashSet的元素又是作为了map的key,当然也不能重复了。
以下是HashMap如何保证key值不重复的代码
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; //缓存底层数组用,都是指向一个地址的引用Node<K,V> p; //插入数组的桶i处的键值对节点int n; //底层数组的长度int i; //插入数组的桶的下标//刚开始table是null或空的时候,初始化个默认的table;为tab和n赋值,tab指向底层数组,n为底层数组的长度if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//(n - 1) & hash:根据hash值算出插入点在底层数组的桶的位置,即下标值;为p赋值,也为i赋值(不管碰撞与否,都已经赋值了)//如果在数组上,没有发生碰撞,即当前要插入的位置上之前没有插入过值,则直接在此位置插入要插入的键值对if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);//插入的节点的next属性是nullelse { //发生碰撞,即当前位置已经插入了值Node<K,V> e; K k;//中间变量吧,跟冒泡排序里面的那个中间变量似的,起到个值交换的作用//hash值相同,key也相同,那么就是更新这个键值对的值。同 jdk 1.7if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;else if (p instanceof TreeNode)//jdk 1.8引入了红黑树来处理碰撞,上面判断p的类型已经是树结构了,e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);//如果是,则走添加树的方法。else {for (int binCount = 0; ; ++binCount) { //还未形成树结构,还是jdk 1.7的链表结构//差别就是1.7:是头插法,后来的留在数组上,先来的链在尾上;1.8:是先来的就留在数组上,后来的链在尾上//判断p.next是否为空,同时为e赋值,若为空,则p.next指向新添加的节点,这是在链表长度小于7的时候if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}//如果在循环链表的时候,找到key相同的节点,那么就跳出循环,就走不到链表的尾上了。if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;//这个就是p.next也就是e不为空,然后,还没有key相同的情况出现,那就继续循环链表,// p指向p.next也就是e,继续循环,继续,e=p.nextp = e;//直到p.next为空,添加新的节点;或者出现key相等,更新旧值的情况才跳出循环。}}//经过上面if else if else之后,e在新建节点的时候,为null;更新的时候,则被赋值。if (e != null) { // existing mapping for keyV oldValue = e.value;//onlyIfAbsent 这个在调用hashMap的put()的时候,一直是false,那么下面更新value是肯定执行的if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}++modCount;if (++size > threshold)resize();afterNodeInsertion(evict);return null;}
其中最关键的一句:
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
调用了对象的hashCode和equals方法进行的判断,
首先要明确:只通过hash码值来判断两个对象时否相同合适吗?答案是不合适的,因为有可能两个不同的对象的hash码值相同;
在java中存在一种hash表结构,它通过一个算法,计算出的结果就是hash码值;这个算法叫hash算法;
hash算法是怎么计算的呢?
是通过对象中的成员来计算出来的结果;
如果成员变量是基本数据类型的值, 那么用这个值 直接参与计算;
如果成员变量是引用数据类型的值,那么获取到这个成员变量的哈希码值后,再参数计算
所以又得出一个结论:若要将对象存放到HashSet中并保证对象不重复,应根据实际情况将对象的hashCode方法和equals方法进行重写