在Java中如何使用Stream.distinct去重元素_Stream去重方法解析

答案:Stream.distinct()基于equals方法去重,需重写equals和hashCode处理自定义对象,内部用HashSet实现,有状态且顺序流中保持顺序。

在Java 8中,Stream.distinct() 方法提供了一种简洁高效的方式来去除流中的重复元素。它基于元素的 equals() 方法判断是否重复,返回一个由不同元素组成的新的流,不改变原始数据源。

distinct() 方法的基本用法

distinct() 是 Stream 接口中的一个中间操作,返回去重后的流。常用于集合、数组等数据结构的处理。

例如,对一个包含重复整数的列表进行去重:

List numbers = Arrays.asList(1, 2, 2, 3, 3, 3, 4);
List distinctNumbers = numbers.stream()
  .distinct()
  .collect(Collectors.toList());
// 结果:[1, 2, 3, 4]

对自定义对象去重的关键:重写 equals 和 hashCode

如果要对自定义对象(如 Person、Student 等)使用 distinct(),必须正确重写 equals()hashCode() 方法。

假设有一个 Person 类:

public class Person {
  private String name;
  private int age;

  // 构造方法、getter 省略

  @Override
  public boolean equals(Object o) {
    if (this == o) return true;
    if (!(o instanceof Person)) return false;
    Person person = (Person) o;
    return age == person.age && Objects.equals(name, person.name);
  }

  @Override
  public int hashCode() {
    return Objects.hash(name, age);
  }
}

使用 distinct() 去除重复的 Person 对象:

List people = Arrays.asList(
  new Person("Alice", 25),
  new Person("Bob", 30),
  new Person("Alice", 25)
);

List uniquePeople = people.stream()
  .distinct()
  .collect(Collectors.toList());
// 只保留两个:Alice/25 和 Bob/30

distinct() 的底层原理与性能说明

distinct() 内部依赖一个 HashSet 来记录已出现的元素。遍历流时,每个元素通过 equals() 判断是否已存在,若不存在则加入结果并放入 Set。

  • 该操作是**有状态的**(stateful),因为它需要保存之前见过的元素
  • 对于大量数据,可能消耗较多内存
  • 顺序流中,distinct() 保

    持元素首次出现的顺序
  • 并行流中,结果顺序不保证,但仍是去重的

基本上就这些。只要确保对象的 equals 和 hashCode 正确实现,Stream.distinct() 就能可靠地完成去重任务,代码清晰且易于维护。