스트림 API3 - 컬렉터
#Java/adv3
컬렉터1
스트림이 중간 연산을 거쳐 최종 연산으로써 데이터를 처리할 때, 그 결과물이 필요한 경우가 많다. 대표적으로 "리스트 나 맵 같은 자료 구조에 담고 싶다"거나 "통계 데이터를 내고 싶다"는 식의 요구가 있을 때, 이 최종 연산에 Collectors를 활용한다.
collect 연산(예: stream.collect(...))은 반환값을 만들어내는 최종 연산이다. collect(Collector<? super T, A, R> collector) 형태를 주로 사용하고, Collectors 클래스 안에 준비된 여러 메서드를 통해서 다양한 수집 방식을 적용할 수 있다.
| 기능 | 메서드 예시 | 설명 | 반환 타입 | 
|---|---|---|---|
| List로 수집 | toList() toUnmodifiableList() | 
스트림 요소를 List로 모은다. toUnmodifiableList()는 불변 리스트를 만든다. | 
List<T> | 
| Set으로 수집 | toSet() toCollection(HashSet::new) | 
스트림 요소를 Set으로 모은다. 중복 요소는 자동으로 제거된다. 특정 Set 타입으로 모으려면 toCollection() 사용. | 
Set<T> | 
| Map으로 수집 | toMap(keyMapper, valueMapper) toMap(keyMapper, valueMapper, mergeFunction, mapSupplier) | 
스트림 요소를 Map에 (키, 값) 형태로 수집한다. 중복 키가 생기면 mergeFunction으로 해결하고, mapSupplier로 맵 타입을 지정할 수 있다. | 
Map<K, V> | 
| 그룹화 | groupingBy(classifier) groupingBy(classifier, downstreamCollector) | 
특정 기준 함수(classifier)에 따라 그룹별로 스트림 요소를 묶는다. 각 그룹에 대해 추가로 적용할 다운스트림 컬렉터를 지정할 수 있다. | Map<K, List<T>> 또는 Map<K, R> | 
| 분할 | partitioningBy(predicate) partitioningBy(predicate, downstreamCollector) | 
predicate 결과가 true와 false 두 가지로 나뉘어, 2개 그룹으로 분할한다. | Map<Boolean, List<T>> 또는 Map<Boolean, R> | 
| 통계 | counting(), summingInt(), averagingInt(), summarizingInt() 등 | 
요소의 개수, 합계, 평균, 최소, 최댓값 등을 구하거나, IntSummaryStatistics 같은 통계 객체로도 모을 수 있다. | 
Long, Integer, Double, IntSummaryStatistics 등 | 
| 리듀싱 | reducing(...) | 
스트림의 reduce()와 유사하게, Collector 환경에서 요소를 하나로 합치는 연산을 할 수 있다. | 
Optional<T> 혹은 다른 타입 | 
| 문자열 연결 | joining(delimiter, prefix, suffix) | 
문자열 스트림을 하나로 합쳐서 연결한다. 구분자(delimiter), 접두사(prefix), 접미사(suffix) 등을 붙일 수 있다. | String | 
| 매핑 | mapping(mapper, downstream) | 
각 요소를 다른 값으로 변환(mapper)한 뒤 다운스트림 컬렉터로 넘긴다. | 다운스트림 결과 타입에 따름 | 
기본적인 수집
// 수정 가능 리스트 반환
List<String> list = Stream.of("Java", "Spring", "JPA")
        .collect(Collectors.toList());
// 수정 불가능 리스트
List<Integer> unmodifiableList = Stream.of(1, 2, 3)
        .collect(Collectors.toUnmodifiableList());
//unmodifiableList.add(4); // 런타임 예외
Set<Integer> set = Stream.of(1, 2, 2, 3, 3, 3)
        .collect(Collectors.toSet());
// 타입 지정
Set<Integer> treeSet = Stream.of(3, 4, 5, 2, 1)
        .collect(Collectors.toCollection(TreeSet::new)); // TreeSet은 정렬 상태를 유지
toList()는 수정 가능한ArrayList로 수집한다.Collectors.toList()대신에 자바 16 부터는stream.toList()를 바로 호출할 수 있다. 이 기능은 불변 리스트를 제공한다.
toUnmodifiableList()는 자바 10부터 제공하는 불변 리스트를 만들어서 수정할 수 없다.toSet()은 중복을 제거한 채로Set에 수집한다.toCollection(TreeSet::new)처럼toCollection()을 사용하면 원하는 컬렉션 구현체를 직접 지정할 수 있다. 예제에서는TreeSet을 선택해 정렬 상태를 유지하게 했다.
Map 수집
Map<String, Integer> map1 = Stream.of("Apple", "Banana", "Tomato")
        .collect(Collectors.toMap(
                name -> name,           // keyMapper
                name -> name.length()   // valueMapper
        ));
// 키 중복 예외: java.lang.IllegalStateException: Duplicate key
/*
Map<String, Integer> map2 = Stream.of("Apple", "Apple", "Banana")
        .collect(Collectors.toMap(
                name -> name,           // keyMapper
                name -> name.length()   // valueMapper
        ));
System.out.println("map2 = " + map2);
*/
// 키 중복 대안 (병합)
Map<String, Integer> map3 = Stream.of("Apple", "Apple", "Banana")
        .collect(Collectors.toMap(
                name -> name,
                name -> name.length(),
                (oldVal, newVal) -> oldVal + newVal // 중복될 경우 기존 값 + 새값
        ));
// Map의 타입 지정
LinkedHashMap<String, Integer> map4 = Stream.of("Apple", "Apple", "Banana")
        .collect(Collectors.toMap(
                name -> name,
                String::length, // 임의 객체의 메서드 참조
                (oldVal, newVal) -> oldVal + newVal, // key 중복 발생 시 조정 로직
                LinkedHashMap::new                   // 결과 Map 타입 지정
        ));
toMap(keyMapper, valueMapper): 각 요소에 대한 키, 값을 지정해서Map을 만든다.- 키가 중복되면 
IllegalStateException이 발생한다(주석 해제 시map2예제). (oldVal, newVal) -> oldVal + newVal같은 병합 함수를 지정하면, 중복 키가 나오더라도 기존 값과 새 값을 합쳐서 처리한다.- 마지막 인자로 
LinkedHashMap::new를 넘기면, 결과를LinkedHashMap으로 얻을 수 있다(입력 순서를 유지). 
컬렉터2
그룹과 분할 수집
// 첫 글자 알파벳을 기준으로 그룹화
List<String> names = List.of("Apple", "Avocado", "Banana", "Blueberry", "Cherry");
Map<String, List<String>> grouped = names.stream()
        .collect(Collectors.groupingBy(name -> name.substring(0, 1)));
System.out.println("grouped = " + grouped);
// 짝수(even)인지 여부로 분할(파티셔닝)
List<Integer> numbers = List.of(1, 2, 3, 4, 5, 6);
Map<Boolean, List<Integer>> partitioned = numbers.stream()
        .collect(Collectors.partitioningBy(n -> n % 2 == 0));
System.out.println("partitioned = " + partitioned);
실행 결과
grouped = {A=[Apple, Avocado], B=[Banana, Blueberry], C=[Cherry]}
partitioned = {false=[1, 3, 5], true=[2, 4, 6]}
groupingBy(...)는 특정 기준(예: 첫 글자)에 따라 스트림 요소를 여러 그룹으로 묶는다. 결과는Map<기준, List<요소>>형태다.partitioningBy(...)는 단순하게true와false두 그룹으로 나눈다. 예제에서는 짝수(true), 홀수(false)로 분할했다.
최솟값 최댓값 수집
Integer max1 = Stream.of(1, 2, 3)
        .collect(Collectors.maxBy(
                (i1, i2) -> i1.compareTo(i2)))
        .get();
Integer max2 = Stream.of(1, 2, 3)
        .max((i1, i2) -> i1.compareTo(i2)).get();
Integer max3 = Stream.of(1, 2, 3)
        .max((Integer::compareTo)).get();
// 기본형 특화 스트림 사용
int max4 = IntStream.of(1, 2, 3)
        .max().getAsInt();
결과는 3으로 모두 동일하다.
Collectors.maxBy(...)나Collectors.minBy(...)를 통해 최소, 최댓값을 구할 수 있다.- 다만 스트림 자체가 제공하는 
max(),min()메서드를 쓰면 더 간단하다. - 기본형 특화 스트림(
IntStream등)을 쓰면.max().getAsInt()처럼 바로 기본형으로 결과를 얻을 수 있다. Collectors의 일부 기능은 스트림에서 직접 제공하는 기능과 중복된다.Collectors의 기능들은 뒤에서 설명할 다운 스트림 컬렉터에서 유용하게 사용할 수 있다.
통계 수집
// 다운스트림 컬렉터에서 유용하게 사용
long count1 = Stream.of(1, 2, 3)
        .collect(Collectors.counting()); // 3
long count2 = Stream.of(1, 2, 3)
        .count(); // 3
// 다운스트림 컬렉터에서 유용하게 사용
double average1 = Stream.of(1, 2, 3)
        .collect(Collectors.averagingInt(i -> i)); // 2.0
// 기본형 특화 스트림으로 변환
double average2 = Stream.of(1, 2, 3)
        .mapToInt(i -> i)
        .average().getAsDouble(); // 2.0
// 기본형 특화 스트림 사용
double average3 = IntStream.of(1, 2, 3)
        .average().getAsDouble(); // 2.0
// 통계
IntSummaryStatistics stats = Stream.of("Apple", "Banana", "Tomato")
        .collect(Collectors.summarizingInt(String::length));
System.out.println(stats.getCount());   // 3
System.out.println(stats.getSum());     // 17 (5+6+6)
System.out.println(stats.getMin());     // 5
System.out.println(stats.getMax());     // 6
System.out.println(stats.getAverage()); // 5.66...
counting()은 요소 개수를 구한다.averagingInt()는 요소들의 평균을 구한다.summarizingInt()는 합계, 최솟값, 최댓값, 평균 등 다양한 통계 정보를 담은IntSummaryStatistics객체를 얻는다.- 자주 쓰이는 통계 메서드로 
summingInt(),maxBy(),minBy(),counting()등이 있다. - Collectors의 일부 기능은 스트림에서 직접 제공하는 기능과 중복된다. Collectors 의 기능들은 뒤에서 설명할 다운 스트림 컬렉터에서 유용하게 사용할 수 있다.
 
리듀싱 수집
List<String> names = List.of("a", "b", "c", "d");
// 컬렉션의 리듀싱은 주로 다운 스트림에 활용 (스트림이 제공하는 리듀싱이 있으므로)
// 모든 이름을 하나의 문자열로 이어 붙이기
String joined1 = names.stream()
        .collect(Collectors.reducing(
                (s1, s2) -> s1 + "," + s2
        )).get();
String joined2 = names.stream()
        .reduce((s1, s2) -> s1 + "," + s2).get();
// 문자열 전용 기능
String joined3 = names.stream()
        .collect(Collectors.joining(","));
String joined4 = String.join(",", "a", "b", "c", "d");
결과는 모두 “a,b,c,d”로 동일하다.
Collectors.reducing(...)은 최종적으로 하나의 값으로 요소들을 합치는 방식을 지정한다. 여기서는 문자열들을,로 이어붙였다.- 스트림 자체의 
reduce(...)메서드와 유사한 기능이다. - 문자열을 이어 붙일 때는 
Collectors.joining()이나String.join()을 쓰는 게 더 간편하다. - Collectors 의 일부 기능은 스트림에서 직접 제공하는 기능과 중복된다. Collectors 의 기능들은 뒤에서 설명할 다운 스트림 컬렉터에서 유용하게 사용할 수 있다.
 
다운 스트림 컬렉터1
다운 스트림 컬렉터가 필요한 이유
groupingBy(...)를 사용하면 일단 요소가 그룹별로 묶이지만, 그룹 내 요소를 구체적으로 어떻게 처리할지는 기본적으로toList()만 적용된다.- 실무에서는 "그룹별 총합, 평균, 최대/최솟값, 매핑된 결과, 통계" 등을 바로 얻고 싶을 때가 많다.
 - 이처럼 그룹화된 이후 각 그룹 내부에서 추가적인 연산 또는 결과물(예: 평균, 합계, 최댓값, 최솟값, 통계, 다른 타입으로 변환 등)을 정의하는 역할을 하는 것이 바로 다운 스트림 컬렉터(Downstream Collector)이다.
 - 이때 다운 스트림 컬렉터를 활용하면 "그룹 내부"를 다시 한번 모으거나 집계하여 원하는 결과를 얻을 수 있다.
- 예: 
groupingBy(분류함수, counting())→ 그룹별 개수 - 예: 
groupingBy(분류함수, summingInt(Student::getScore))→ 그룹별 점수 합계 - 예: 
groupingBy(분류함수, mapping(Student::getName, toList()))→ 그룹별 학생 이름 리스트 
 - 예: 
 
다운 스트림 컬렉터란?
Collectors.groupingBy(...)또는Collectors.partitioningBy(...)에서 두 번째 인자로 전달되는Collector를 가리켜 "다운 스트림 컬렉터"라 한다.- 분류된 각 그룹 내부 요소들을 다시 한 번 어떻게 처리할 지 정의하는 역할을 한다.
// 예시 Map<KeyType, DownstreamResult> result = stream.collect(Collectors.groupingBy( element -> 분류 기준 Key, // 1) groupingBy용 분류 함수 downstreamCollector // 2) 그룹 내부를 처리할 다운 스트림 컬렉터 )); - 만약 다운 스트림 컬렉터를 명시하지 않으면, 기본적으로 
Collectors.toList()가 적용되어서 그룹별 요소들을List로 모은다. - 그러나 그룹별 개수를 세거나, 평균을 구하거나, 특정 필드를 뽑아서 맵핑하거나 등등의 작업이 필요하다면, 적절한 다운 스트림 컬렉터를 추가로 지정해야 한다.
- 예를 들어, 
groupingBy(분류 함수, counting())라면 "각 그룹에 속한 요소들의 개수"를 구하는 다운 스트림 컬렉터가 된다. - 또 
groupingBy(분류 함수, averagingInt(속성))라면 "각 그룹에 속한 요소들의 속성 평균"을 구하게 된다. 
 - 예를 들어, 
 - 여러 
Collector를 중첩할 수도 있다. 예:groupingBy(분류 함수, mapping(다른 함수, toList()))처럼 "각 그룹에서 특정 속성만 매핑한 뒤List로 수집하기" 등을 할 수 있다. 
다운 스트림 컬렉터의 종류
| Collector | 사용 메서드 예시 | 설명 | 예시 반환 타입 | 
|---|---|---|---|
| counting() | Collectors.counting() | 
그룹 내(혹은 스트림 내) 요소들의 개수를 센다. | Long | 
| summingInt() 등 | Collectors.summingInt(...)Collectors.summingLong(...) | 
그룹 내 요소들의 특정 정수형 속성을 모두 합산한다. | Integer, Long 등 | 
| averagingInt() 등 | Collectors.averagingInt(...)Collectors.averagingDouble(...) | 
그룹 내 요소들의 특정 속성 평균값을 구한다. | Double | 
| minBy(), maxBy() | Collectors.minBy(Comparator)Collectors.maxBy(Comparator) | 
그룹 내 최소, 최댓값을 구한다. | Optional | 
| summarizingInt() 등 | Collectors.summarizingInt(...)Collectors.summarizingLong(...) | 
개수, 합계, 평균, 최소, 최댓값을 동시에 구할 수 있는 SummaryStatistics 객체를 반환한다. | IntSummaryStatistics 등 | 
| mapping() | Collectors.mapping(변환 함수, 다운스트림) | 
각 요소를 다른 값으로 변환한 뒤, 변환된 값들을 다시 다른 Collector로 수집할 수 있게 한다. | 다운스트림 반환 타입에 따라 달라짐 | 
| collectingAndThen() | Collectors.collectingAndThen(다른 컬렉터, 변환 함수) | 
다운 스트림 컬렉터의 결과를 최종적으로 한 번 더 가공(후처리)할 수 있다. | 후처리 후의 타입 | 
| reducing() | Collectors.reducing(초깃값, 변환 함수, 누적 함수)Collectors.reducing(누적 함수) | 
스트림의 reduce()와 유사하게, 그룹 내 요소들을 하나로 합치는 로직을 정의할 수 있다. | 
누적 로직에 따라 달라짐 | 
| toList(), toSet() | Collectors.toList()Collectors.toSet() | 
그룹 내(혹은 스트림 내) 요소를 리스트나 집합으로 수집한다. toCollection(...)으로 구현체 지정 가능  | 
List, Set | 
groupingBy(...) , partitioningBy(...) 에서 두 번째 인자로 활용되거나, 스트림의 collect() 에서 직접 쓰이기도 한다.
예제
public class Student {
    private String name;
    private int grade;
    private int score;
    // Constructor, Getter, Setter, toString()
// 1단계: 학년별로 학생들을 그룹화 해라.
Map<Integer, List<Student>> collect1_1 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,    // 그룹화 기준: 학년
                Collectors.toList()   // 다운스트림1: 학생을 리스트로 수집
        ));
// 다운스트림에서 toList() 생략 가능
Map<Integer, List<Student>> collect1_2 = students.stream()
        .collect(Collectors.groupingBy(Student::getGrade));
// 2단계: 학년별로 학생들의 이름을 출력해라.
Map<Integer, List<String>> collect2 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,                // 그룹화 기준: 학년
                Collectors.mapping(Student::getName, // 다운스트림 1: 학생 -> 이름 변환
                        Collectors.toList()       // 다운스트림 2: 변환된 값(이름)을 List로 수집
                )
        ));
// 3단계: 학년별로 학생들의 수를 출력해라.
Map<Integer, Long> collect3 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,
                Collectors.counting()
        ));
// 4단계: 학년별로 학생들의 평균 성적 출력해라.
Map<Integer, Double> collect4 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,
                Collectors.averagingInt(Student::getScore)
        ));
groupingBy(Student::getGrade, mapping(Student::getName, toList()))- 스트림의 
map을 떠올리면 된다. - 먼저 "학년"으로 그룹화한 뒤, 그 그룹 내부에서 다시 학생(
Student)을 "이름(String)"으로 매핑(mapping). 그리고 최종적으로 그 이름들을 리스트에 담는다. - 즉, 그룹별로 학생들의 이름 목록을 얻는다.
 
- 스트림의 
 groupingBy(Student::getGrade, counting())- 그룹별로 학생 수를 구한다. 결과는 
Map<Integer, Long>. 
- 그룹별로 학생 수를 구한다. 결과는 
 groupingBy(Student::getGrade, averagingInt(Student::getScore))- 그룹별로 학생들의 점수 평균을 구한다. 결과는 
Map<Integer, Double>. 
- 그룹별로 학생들의 점수 평균을 구한다. 결과는 
 
다운 스트림 컬렉터2
List<Student> students = List.of(
        new Student("Kim", 1, 85),
        new Student("Park", 1, 70),
        new Student("Lee", 2, 70),
        new Student("Han", 2, 90),
        new Student("Hoon", 3, 90),
        new Student("Ha", 3, 89)
);
// 1단계: 학년별로 학생들을 그룹화 해라.
Map<Integer, List<Student>> collect1 = students.stream()
        .collect(Collectors.groupingBy(Student::getGrade));
// 2단계: 학년별로 가장 점수가 높은 학생을 구해라. reducing 사용
Map<Integer, Optional<Student>> collect2 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,
                Collectors.reducing((s1, s2) -> s1.getScore() > s2.getScore() ? s1 : s2)
        ));
// 3 단계: 학년별로 가장 점수가 높은 학생을 구해라. maxBy 사용
Map<Integer, Optional<Student>> collect3 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,
                //Collectors.maxBy((s1, s2) -> s1.getScore() > s2.getScore() ? 1 : -1)
                //Collectors.maxBy(Comparator.comparingInt(student -> student.getScore()))
                Collectors.maxBy(Comparator.comparingInt(Student::getScore))
        ));
// 4단계: 학년별로 가장 점수가 높은 학생의 이름을 구해라 (collectingAndThen + maxBy 사용)
// 학년별 그룹 -> 그룹별 가장 점수가 높은 학생 -> 그룹별 학생 -> 그룹별 이름
Map<Integer, String> collect4 = students.stream()
        .collect(Collectors.groupingBy(
                Student::getGrade,
                Collectors.collectingAndThen(
                        Collectors.maxBy(Comparator.comparingInt(Student::getScore)),
                        sOpt -> sOpt.get().getName()
                )
        ));
학년별 최대 점수 학생 구하기(reducing 사용, collect2)
Collectors.reducing(...)은 그룹 내부의 학생들을 하나씩 비교하며 축소(reduce)하는 로직을 적용한다.(s1, s2) -> s1.getScore() > s2.getScore() ? s1 : s2라는 식으로, 그룹 내의 학생 2명을 비교해 더 큰 점수를 가진Student를 반환하도록 했다. 그룹 내부의 모든 학생에 대해서 해당 로직을 적용한다. 따라서 각 그룹 별로 최종 1명의 학생이 남는다.- 최종 결과는 
Map<Integer, Optional<Student>>형태이다.- 처음부터 학생이 하나도 없다면 결과도 없다. 따라서 
Optional을 반환한다. 
 - 처음부터 학생이 하나도 없다면 결과도 없다. 따라서 
 
학년별 최대 점수 학생 구하기(maxBy 사용, collect3)
Collectors.maxBy(Comparator.comparingInt(Student::getScore))를 쓰면 간단히 최댓값 비교를 할 수 있다.- 최종 결과는 
Map<Integer, Optional<Student>>형태이다. 
학년별 최대 점수 학생의 "이름"만 구하기(collect4)
컬렉팅이 이미 다 끝났는데, 최종 결과를 한 번더 가공하고 싶을 때.
collectingAndThen은 다운 스트림 컬렉터가 만든 결과를 한 번 더 후처리(And Then)할 수 있도록 해준다.- 여기서는 
maxBy(...)로Optional<Student>가 만들어지면, 그 안에서Student::getName을 꺼내 최종적으로String이 되도록 변환하고 있다. - 따라서 결과는 
Map<Integer, String>형태가 되며, 각 학년별로 점수가 가장 높은 학생의 이름만 구한다. 
mapping() vs collectingAndThen()
mapping(): 그룹화(또는 분할)된 각 그룹 내의 개별 요소들을 다른 값으로 변환(mapping)한 뒤, 그 변환된 값들을 다시 다른 Collector로 수집할 수 있게 해준다.collectingAndThen(): 다운 스트림 컬렉터가 최종 결과를 만든 뒤에 한 번 더 후처리할 수 있도록 해준다. 즉, "1차 Collector → 후처리 함수" 순서로 작업한다.
| 구분 | mapping() | collectingAndThen() | 
|---|---|---|
| 주된 목적 | 그룹 내 개별 요소를 변환한 뒤, 해당 변환 결과를 다른 Collector로 수집 | 그룹 내 요소들을 이미 한 번 수집한 결과를 추가 가공하거나 최종 타입으로 변환 | 
| 처리 방식 | (1) 그룹화 → (2) 각 요소를 변환(매핑) → (3) 리스트나 Set 등으로 수집 | (1) 그룹화 → (2) 최댓값/최솟값/합계 등 수집 → (3) 결과를 후처리(예: Optional → String) | 
| 대표 예시 | mapping(Student::getName, toList()) | 
collectingAndThen(maxBy(...), optional -> optional.map(...) ...) | 
정리
다운 스트림 컬렉터를 이해하면, groupingBy() 나 partitioningBy() 로 그룹화/분할을 한 뒤 내부 요소를 어떻게 가공하고 수집할지 자유롭게 설계할 수 있다.
mapping(),counting(),summarizingInt(),reducing(),collectingAndThen(),maxBy(),minBy(),summingInt(),averagingInt()등 다양한Collector메서드를 조합하여 복잡한 요구사항도 단 한 번의 스트림 파이프라인으로 처리할 수 있다.
'Java > Modern Java(8~)' 카테고리의 다른 글
| [Java] 67. 디폴트 메서드 (0) | 2025.07.04 | 
|---|---|
| [Java] 66. Optional (0) | 2025.07.04 | 
| [Java] 64. 스트림 API2 - 기능 (0) | 2025.07.04 | 
| [Java] 63. 스트림 API1 - 기본 (0) | 2025.07.04 | 
| [Java] 62. 메서드 참조 (0) | 2025.07.04 |