java集合
java容器类类库的用途是“保存对象”,并将其划分为两个不同的概念:
(1)Collection。一个独立元素的序列,这些元素都服从一条或多条规则。List必须按照插入的顺序保存元素,而Set不能有重复元素。queue按照排队规则来确定对象产生的顺序。
(2)Map。一组成对的“键值对”对象,允许你使用键来查找值。映射表让我们能够使用一个对象来查找另一个对象,就像“字典”一样。Map是强大的编程工具。
Map接口和Collection接口的不同
-
Map是双列的,Collection是单列的
-
Map的键唯一,Collection的子体系Set是唯一的
-
Map集合的数据结构是针对键有效,跟值无关
-
Collection集合的数据结构是针对元素有效
一, Collection接口
(1). collection接口的成员方法
增加: boolean add(E e)
删除: boolean remove(Object o)
清空: void clear()
包含: boolean contains(Object o)
判断为空: boolean isempty()
容量: int size()
boolean addAll(Collection c)
boolean removeAll(Collection c)
boolean containsAll(Collection c)
boolean retainAll(Collection c)
(2). Object[] toArray()
把集合转成数组,可以实现集合的遍历.
(3). Iterator iterator()
迭代器,集合的专用遍历方式.
-
使用方法iterator()要求容器返回一个Iterator
-
boolean hasNext() 检查是否有下一个元素
-
E next() 获取下一个元素
-
remove() 将迭代器新进返回的元素删除
1, List接口(继承Connection)
- ArrayList(开发中用的很多)
- 底层数据结构是一个自增长的数组,查询快,增删慢.
- 线程不安全,效率高.
- LinkedList
- 底层数据结构是链表(存储地址不连续),查询慢,增删快
- 线程不安全,效率高
- LinkedList类特有功能
public void addFirst(E e)及addLast(E e)
public E getFirst()及getLast()
public E removeFirst()及public E removeLast()
-
底层数据结构是也是数组,查询快,增删慢.
-
线程安全,效率低.
-
Vector类特有功能:
public void addElement(E obj)
public E elementAt(int index)
public Enumeration elements()
2, Set接口(继承Connection)
Set是一个不包含重复元素的 collection。Set中最常被使用的是测试归属性,你可以很容易的查询某个对象是否在其中。正因如此,查找成了set中的重要操作,因此你通常都会选择一个HashSet实现,它专门进行了优化。
Set具有与Collection完全一样的接口,因此没有任何额外的功能,不像List一样有不同的list。实际上Set就是Collection,只是行为不同。加入Set的元素必须定义equals方法以确保对象的唯一性
-
HashSet:为快速查找而设计的Set。存入HashSet的元素必须定义hashCode()方法,不保证set的迭代顺序,特别是它不保证该顺序恒久不变。
HashSet如何保证元素唯一性?底层数据结构是哈希表(元素是链表的数组)哈希表依赖于哈希值存储添加功能底层依赖两个方法: int hashCode()
boolean equals(Object obj)
-
LinkedHashSet:具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。元素也必须定义hashCode()方法
- 元素有序唯一
- 由链表保证元素有序
- 由哈希表保证元素唯一
- treeset:保持次序的set,底层为树结构。使用它可以从set中提取有序的序列。元素必须实现Comparable接口。
- 使用元素的自然顺序对元素进行排序
- 或者根据创建 set 时提供的 Comparator 进行排序
- 具体取决于使用的构造方法。
必须提的一点:TreeSet是如何保证元素的排序和唯一性的?
底层数据结构是红黑树(红黑树是一种自平衡的二叉树)!
各种set集合性能分析
- HashSet和TreeSet是Set集合中用得最多的集合。HashSet总是比TreeSet集合性能好,因为HashSet不需要额外维护元素的顺序。
- LinkedHashSet需要用额外的链表维护元素的插入顺序,因此在插入时性能比HashSet低,但在迭代访问(遍历)时性能更高。因为插入的时候即要计算hashCode又要维护链表,而遍历的时候只需要按链表来访问元素。
- EnumSet元素是所有Set元素中性能最好的,但是它只能保存Enum类型的元素
3, Queue接口
Queue队列,它主要分为两大类,一类是阻塞式队列,队列满了以后再插入元素则会抛出异常,主要包括ArrayBlockQueue、priorityblockingqueue、LinkedBlockingQueue。另一类则是双端队列,支持在头、尾两端插入和移除元素,主要包括:ArrayDeque、LinkedBlockingDeque、**LinkedList**。
Queue用于模拟队列这种数据结构,队列通常是指“先进先出”的容器。队列的头部保存在队列中时间最长的元素,队列的尾部 保存在队列中时间最短的元素。新元素插入到队列的尾部,访问元素操作会返回队列头部的元素。通常,队列不允许随机访问队列中的元素。
Queue接口中定义了如下操作方法:
void add(Object e): 将指定元素加入此队列的尾部。
Object element(): 获取队列头部的元素,但是不删除该元素。
boolean offer(Object e): 将指定元素加入此队列的尾部。当使用有容量限制的队列时,此方法通常比add(Object e)方法更好。
Object peek(): 获取队列头部的元素,但是不删除该元素。如果此队列为空,则返回null。
Object poll(): 获取队列头部的元素,并删除该元素。如果此队列为空,则返回null。
Object remove(): 获取队列头部的元素,并删除该元素。
Queue有两个常用的实现类:LinkedList和PriorityQueue。
LinkedList类 是一个比较奇怪的类,它是List接口的实现类–这意味着它是一个List集合,可以根据索引来随机访问集合中的元素。除此之外,LinkedList还实现了Deque接口,Deque接口是Queue接口的子接口,它代表一个双向队列Deque接口里定义了一些可以双向操作队列的方法。
LinkedList与ArrayList的实现机制完全不同,ArrayList内部以数组的形式来保存集合中的元素,因此随机访问集合元素上有较好的性能;而LinkedList内部以链表的形式来保存集合中的元素,因此随机访问集合元素时性能较差,但在插入、删除元素时性能非常出色(只需改变指针所指的地址即可)。
通常的编程过程中无须理会ArrayList和LinkedList之间的性能差异,只需知道LinkedList集合不仅提供了List的
功能,还额外提供了的双向队列、栈的功能。但在一些性能非常敏感的地方,可能需要慎重选择哪个List实现。
4, Map接口(实现Connection)
Map的思想,映射表(也可以称为关联数组)的基本思想是它维护的键-值(对)关联,因此你可以使用键来查找值。标准的Java类库中包含了Map的集中基本实现类,包括HashMap,TreeMap、LinkedHashMap、weakhashmap,ConcurrentHashMap、IdentityHashMap。它们都有同样的基本接口Map,但是行为特效各不同,这表现在效率、键值对的保存及呈现次序、对象的保存周期、映射表如何在多线程程序中工作和判定“键”等价的策略等方面。Map接口实现的数量应该可以让你感觉到这种工具的重要性。
Map接口成员方法:
V put(K key,V value)
V remove(Object key)
void clear()
boolean containskey(Object key)
boolean containsValue(Object value)
boolean isEmpty()
int size()
V get(Object key)
Set keySet()
Collection values()
Set<Map.Entry<K,V>> entrySet()
这里提一下Map的遍历方式吧:
方式1:根据键找值
获取所有键的集合
遍历键的集合,获取到每一个键
根据键找值
方式2:根据键值对对象找键和值
获取所有键值对对象的集合
遍历键值对对象的集合,获取到每一个键值对对象
根据键值对对象找键和值
- HashMap:Map基于散列表的实现(它取代 了Hashtable)。插入和查询“键值对”的开销是固定的。可以通过构造器设置容器和负载因子,以调整容器的性能。
- LinkedHashMap:类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用的(LRU)的次序。只是比HashMap慢一点,而在迭代访问时,反而更快,因为它使用链表维护内部次序。
- TreeMap:基于红黑树的实现,查看“键”或“键值对”时,它们会被排序(次序由Comparable或Comparator决定)。TreeMap的特点在于所得到的结果是经过排序的。TreeMap是唯一带有subMap()方法的Map,它可以返回一个子树
- WeakHashMap:弱键(weak key)映射,允许释放映射所指向的对象,这是为解决某类特殊问题而设计的。如果映射之外没有引用指向某个“键”,则此键可以被垃圾回收器回收。
- ConcurrentHashMap:一种线程安全的Map,它不涉及加同步锁。
- IdentityHashMap:使用==代替equals()对“键”进行比较的散列映射。专为解决特殊问题而设计的。
既然谈到了HashMap那么就来总结一下与Hashtable的不同,最直观的方法,看其底层实现的源码。
1.它们的家族就不同,虽然都实现了Map接口,但HashMap是继承自AbstractMap,Hashtable继承自古老的Dictionary
2.HashMap是允许key为null的,而Hashtbale是不允许的
3.在Hashtable的源码里,一眼我们就能看到一个关键字 -----**synchronized ,**所以其是线程同步的,HashMap不是线程同步的,所以效率会高上一些,简而言之,HashMap是Hashtable的轻量级实现(非线程安全实现)
最大的不同是,Hashtable的方法是Synchronize的,而HashMap不是,在多个线程访问Hashtable时,不需要自己为它的方法实现同步,而HashMap 就必须为之提供外同步(Collections.synchronizedMap)。
二、各种集合的异同点
1、Vector和ArrayList
1,vector是线程同步的,所以它也是线程安全的,而arraylist是线程异步的,是不安全的。如果不考虑到线程的安全因素,一般用arraylist效率比较高。
2,如果集合中的元素的数目大于目前集合数组的长度时,vector增长率为目前数组长度的100%,而arraylist增长率为目前数组长度的50%.如果在集合中使用数据量比较大的数据,用vector有一定的优势。
3,如果查找一个指定位置的数据,vector和arraylist使用的时间是相同的,都是0(1),这个时候使用vector和arraylist都可以。而如果移动一个指定位置的数据花费的时间为0(n-i)n为总长度,这个时候就应该考虑到使用arraylist,因为它移动一个指定位置的数据所花费的时间为0(1),而查询一个指定位置的数据时花费的时间为0(i)。
ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要涉及到数组元素移动等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差,LinkedList使用双向链表实现存储,按序号索引数据需要进行向前或向后遍历,但是插入数据时只需要记录本项的前后项即可,所以插入数度较快!
2、Aarraylist和Linkedlist
1.ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。
2.对于随机访问get和set,ArrayList绝对优于LinkedList,因为LinkedList要移动指针。
3.对于新增和删除操作add和remove,LinkedList比较占优势,因为ArrayList要移动数据。
这一点要看实际情况的。若只对单条数据插入或删除,ArrayList的速度反而优于LinkedList。但若是批量随机的插入删除数据,LinkedList的速度大大优于ArrayList. 因为ArrayList每插入一条数据,要移动插入点及之后的所有数据。
3、HashMap与TreeMap
1、 HashMap通过hashcode对其内容进行快速查找,而TreeMap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用TreeMap(HashMap中元素的排列顺序是不固定的)。集合框架”提供两种常规的Map实现:HashMap和TreeMap (TreeMap实现SortedMap接口)。
2、在Map 中插入、删除和定位元素,HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。 TreeMap没有这个调优选项,因为该树总处于平衡状态。
4、hashtable与hashmap
1、历史原因:Hashtable是基于陈旧的Dictionary类的,HashMap是Java 1.2引进的Map接口的一个实现 。
2、同步性:Hashtable是线程安全的,也就是说是同步的,而HashMap是线程序不安全的,不是同步的 。
3、值:只有HashMap可以让你将空值作为一个表的条目的key或value 。
三、对集合的选择
1、对List的选择
1、对于随机查询与迭代遍历操作,数组比所有的容器都要快。所以在随机访问中一般使用ArrayList
2、LinkedList使用双向链表对元素的增加和删除提供了非常好的支持,而ArrayList执行增加和删除元素需要进行元素位移。
3、对于Vector而言,我们一般都是避免使用。
4、将ArrayList当做首选,毕竟对于集合元素而已我们都是进行遍历,只有当程序的性能因为List的频繁插入和删除而降低时,再考虑LinkedList。
2、对Set的选择
1、HashSet由于使用HashCode实现,所以在某种程度上来说它的性能永远比TreeSet要好,尤其是进行增加和查找操作。
3、虽然TreeSet没有HashSet性能好,但是由于它可以维持元素的排序,所以它还是存在用武之地的。
3、对Map的选择
1、HashMap与HashSet同样,支持快速查询。虽然HashTable速度的速度也不慢,但是在HashMap面前还是稍微慢了些,所以HashMap在查询方面可以取代HashTable。
2、由于TreeMap需要维持内部元素的顺序,所以它通常要比HashMap和HashTable慢。
文章最后发布于: 2018-10-06 14:25:09
相关阅读
List是集合容器的一种,在分析List之前,我们先来了解一下集合体系的架构: Why–为什么需要集合 首先,Java是一门面向对象的语言,奉承
java反射获取参数名,idea如何开启-parameters
在8以前的jdk版本的时候,我们利用反射只能获取到参数类型,然后参数名字都是利用arg0,arg1,arg2......所以在使用一些反射编程方面上
本次旅行的第一站是香港会展中心新翼。香港会议展览中心 (简称香港会展中心)位于香港湾仔的是香港区海边最新建筑群中的代表者之
B/S: 开发基于B/S结构项目:目前主要采用三种服务器端语言:JSP,PHP,ASP.NET。 这三种语言构成三种常用应用开发组合:JSP+Oracle组合、P
java-多线程-CountDownLatch(闭锁) CyclicBarrier(栅
(代码来源网络共享) 这几个工具类其实说白了就是为了能够更好控制线程之间的通讯问题~ CountDownLatch 是一个同步的辅助类,允许