JAVA和Nginx 教程大全

网站首页 > 精选教程 正文

Java性能优化:警惕List使用陷阱(lists java)

wys521 2025-04-08 20:05:38 精选教程 24 ℃ 0 评论

在Java编程中,List集合最常用的数据结构之一,用于存储一组有序、可重复的元素。它继承自Collection接口,其中ArrayList和LinkedList是最常用的两个实现类。本文将深入探讨List集合的使用技巧和注意事项,帮助你避免常见的陷阱并提升代码的安全性与执行效率。


01

禁止在 foreach 循环里进行元素的 remove/add 操作

在日常编程开发中,经常会遇到“遍历List,然后对List中的元素按照某种条件进行删除(remove)操作”的场景。

根据阿里巴巴的《JAVA开发手册》建议:

不要在 foreach 循环里进行元素的 remove/add 操作。remove 元素请使用 Iterator方式,如果并发操作,需要对 Iterator 对象加锁。

1.1 错误的写法

当使用foreach遍历集合时对集合元素进行 remove/add 操作时,就会抛出
ConcurrentModificationException异常

下面以remove操作为例,如下所示:

运行上面的代码,会抛出如下的
ConcurrentModificationException
异常:

为什么会这样呢?

究其原因根本在于:foreach其底层实现实际上还是利用iterator和while循环来实现的,如下反编译代码所示:

以ArrayList为例,这里有两个重要的成员变量:

  • 1)modCount:它是ArrayList中的一个成员变量,它表示集合实际被修改的次数,当ArrayList被创建时就存在了,初始值为0。如下所示:
protected transient int modCount = 0;
  • 2)expectedModCount:它是iterator中的一个成员变量,当ArrayList调用iterator()方法获取一个迭代器时,会创建一个iterator,并且将expectedModCount 初始化为modCount的值。

即在循环迭代时,会首先创建一个迭代实例,这个迭代实例的expectedModCount 初始化为modCount的值。而每当迭代器使用 hashNext() 与next() 遍历下一个元素之前,都会检测 expectedModCount 与modCount 的值是否相等。如果相等则遍历;否则就抛出
ConcurrentModificationException异常,终止遍历。

如果在循环中删除或者添加元素时,会直接调用集合的remove()与add()方法,从而导致了modCount减少或者增加。但是,这些方法并不会修改迭代实例中的expectedModCount,从而导致在迭代实例中expectedModCount与modCount的值不相等,抛出
ConcurrentModificationException异常。

1.2 正确的写法

  • 1)推荐使用Lambda表达式的方式,该方式其语法较为简洁,且效率也不错,如下所示:
  • 2)使用迭代器(Iterator)的方式,迭代器提供了一种安全的方式来修改集合中的元素。同时,该方式也是阿里巴巴的《JAVA开发手册》所推荐的写法,如下所示:
  • 3)最后,您也可以使用最传统的方式,如下所示:


02

ArrayList中的 subList 强转 ArrayList 会导致异常

在阿里巴巴的《JAVA开发手册》中这样描述:

ArrayList的subList结果不可强转成ArrayList,否则会抛出ClassCastException异常,即
java.util.RandomAccessSubList cannot be cast to java.util.ArrayList.

说明:subList 返回的是 ArrayList 的内部类 SubList,并不是 ArrayList ,而是ArrayList 的一个视图,对于 SubList 子列表的所有操作最终会反映到原列表上。

来看一个段示例代码,如下所示:

不出意外的是,该代码抛出ClassCastException异常,如下所示:

java.lang.ClassCastException: class java.util.ArrayList$SubList cannot be cast to class java.util.ArrayList (java.util.ArrayList$SubList and java.util.ArrayList are in module java.base of loader 'bootstrap')


要解决方案上面的问题,您可以通过new一个新的ArrayList对象来接收创建subList结果的拷贝就可以了,如下所示:


03

集合转数组必须使用集合的 toArray(T[] array)方法

根据阿里巴巴的《Java 开发手册》建议,在调用集合转换数组的方法时,必须调用集合的 toArray(T[] array)方法。同时,传入类型完全一样的数组,数组大小为 list.size()。

使用 toArray 带参的方法,入参分配的数组空间不够大时,toArray 方法内部将重新分配内存空间,并返回新数组地址;如果数组元素大于实际所需,下标为[ list.size() ]的数组元素将被置为 null,其它数组元素保持原值,因此最好将方法入参数组大小定义与集合元素个数一致。如下所示:

04—数组转集合Arrays.asList()时,不能调用修改集合的相关方法

根据阿里巴巴的《Java 开发手册》建议:在调用数组转换集合的 Arrays.asList()方法时,不能调用其修改集合相关的方法,它的 add/remove/clear 方法会抛出
UnsupportedOperationException 异常。

其原因在于:

asList 的返回对象是一个 Arrays 内部类,并没有实现集合的修改方法。Arrays.asList体现的是适配器模式,只是转换接口,后台的数据仍然是数组。如下所示:

05

LinkedList插入就一定比ArrayList执行效率高吗

我们知道,ArrayList底层维护的是一个动态数组,LinkedList底层维护的是一个双向链表。因此,单从数据结构的角度来讲,元素的插入操作对于链表来说应该是优于数组的。

来看下面一段测试代码:

分别执行1000条与100000条数据插入,其结果如下所示:

由此可见,并非在任何时候插入操作都是LinkedList比ArrayList执行效率高,究其原因主要还是在add()方法上,这里就不再继续阐述了。

一般来说,在以下三种情况LinkedList比ArrayList执行效率高:

  • 1)向集合中间插入数据时

ArrayList往集合中间插入数据要做两个事:把之前的数据挪开赋值到新的数组位置,然后把需要插入的数据插入到数组对应的位置。

LinkedList只要修改对应位置数据prev和next对象的指向就可以了。

  • 2)集合删除数据时

原理与集合中间插入数据是一样的,ArrayList每次删除数据都要对数组重组。

  • 3)ArrayList扩容时

因为ArrayList维护的是一个数组,所以当容量到达阈值时就会进行扩容,然后会重新分配数据的位置,当数组扩容的时候速度也要比LinkedList慢。

毫无疑问的是,在查询数据时,LinkedList肯定比ArrayList执行效率低。因为ArrayList数组下标标记数据位置,查询时直接返回对应数组下标数据即可;而LinkedList因为链表的关系,每次获取固定位置的数据都需要循环遍历链表。

06

高效地使用List遍历方式

在日常开发中,我们常用的List遍历有如下4种类型:

  • 1)普通for循环与foreach循环(增强for)遍历方式,如下所示:
  • 2)迭代器(Iterator)遍历方式,如下所示:
  • 3)Lambda表达式遍历方式,如下所示:
  • 4)Stream API遍历方式,如下所示:

对于上面4种类型的遍历方式,虽然都有各自的特点,但基于编程的简洁性与执行效率,优先推荐Stream API(谨慎使用并行流)与Lambda表达式遍历方式。同时,在遍历前要对List做空值判断,以避免NullPointerException异常发生。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表