02. 커넥션풀과 데이터소스 이해

정리

이전 챕터에서 학습한 코드의 동작 방식에는 한 가지 큰 문제점이 있다. 쿼리를 날릴 때 마다 커넥션을 매번 획득한다는 점이다.

데이터베이스 커넥션을 획득할 때는 복잡한 과정을 거친다.

애플리케이션 로직은 DB 드라이버를 통해 커넥션을 조회한다.
DB 드라이버는 DB와 TCP/IP 커넥션을 연결한다. 물론 이 과정에서 3 way handshake 같은 TCP/IP 연결을 위한 네트워크 동작이 발생한다.
DB 드라이버는 TCP/IP 커넥션이 연결되면 ID, PW와 기타 부가정보를 DB에 전달한다.
DB는 ID, PW를 통해 내부 인증을 완료하고, 내부에 DB 세션을 생성한다.
DB는 커넥션 생성이 완료되었다는 응답을 보낸다.
DB 드라이버는 커넥션 객체를 생성해서 클라이언트에 반환한다.

커넥션을 획득하는 과정에서 오버헤드가 발생하기 때문에, 매 번 커넥션을 만드는 것은 매우 비효율적이다. DB는 물론이고 애플리케이션 서버에서도 TCP/IP 커넥션을 새로 생성하기 위한 리소스를 매번 사용해야 한다. 이러한 문제는 사용자 경험에도 매우 안좋은 영향을 미친다.

이를 개선하기 위해서는 어떤 방식을 사용할 수 있을까? CS의 기본기를 잘 다진 분이라면 쉽게 떠올릴 수 있다.
자바에서 문자열 성능을 최적화하기 위해 문자열 풀을 사용하는 것처럼, DB 커넥션 성능을 최적화하기 위해 커넥션 풀에 커넥션을 만들어 놓고, 필요할 때 가져다 사용하는 방식을 사용할 수 있다.

커넥션 풀 초기화

애플리케이션을 시작하는 시점에 커넥션 풀은 필요한 만큼 커넥션을 미리 확보해서 풀에 보관한다. 보통 얼마나 보관할지는 서비스의 특징과 서버 스펙에 따라 다르지만 기본값은 보통 10개이다.

커넥션 풀의 연결 상태

커넥션 풀에 들어 있는 커넥션은 TCP/IP로 DB와 커넥션이 연결되어 있는 상태이기 때문에 언제든지 즉시 SQL을 DB에 전달할 수 있다.

커넥션 풀 사용

애플리케이션 로직에서 이제는 DB 드라이버를 통해서 새로운 커넥션을 획득하는 것이 아니다. 이제는 커넥션 풀을 통해 이미 생성되어 있는 커넥션을 객체 참조로 그냥 가져다 쓰기만 하면 된다.

커넥션 풀에 커넥션을 요청하면 커넥션 풀은 자신이 가지고 있는 커넥션 중에 하나를 반환한다.

애플리케이션 로직은 커넥션 풀에서 받은 커넥션을 사용해서 SQL을 데이터베이스에 전달하고 그 결과를 받아서 처리한다.

커넥션을 모두 사용하고 나면 이제는 커넥션을 종료하는 것이 아니라, 다음에 다시 사용할 수 있도록 해당 커넥션을 그대로 커넥션 풀에 반환하면 된다. 여기서 주의할 점은 커넥션을 종료하는 것이 아니라 커넥션이 살아있는 상태로 커넥션 풀에 반환해야 한다는 것이다.

적절한 커넥션 풀 숫자는 서비스의 특징과 애플리케이션 서버 스펙, DB 서버 스펙에 따라 다르기 때문에 성능 테스트를 통해서 정해야 한다.
커넥션 풀은 서버당 최대 커넥션 수를 제한할 수 있다. 따라서 DB에 무한정 연결이 생성되는 것을 막아주어서 DB를 보호하는 효과도 있다.
커넥션 풀은 개념적으로 단순해서 직접 구현할 수도 있지만, 사용도 편리하고 성능도 뛰어난 오픈소스 커넥션 풀이 많기 때문에 오픈소스를 사용하는 것이 좋다.
- 대표적인 커넥션 풀 오픈소스는 commons-dbcp2, tomcat-jdbc pool, HikariCP 등이 있다.
성능과 사용의 편리함 측면에서 최근에는 HikariCP를 주로 사용한다. 스프링 부트 2.0부터는 기본 커넥션 풀로 HikariCP를 제공한다. 성능, 사용의 편리함, 안전성 측면에서 이미 검증이 되었기 때문에 커넥션 풀을 사용할 때는 고민할 것 없이 HikariCP를 사용하면 된다. 실무에서도 레거시 프로젝트가 아닌 이상 대부분 HikariCP를 사용한다.

DataSource

이전 챕터에서는 커넥션을 DriverManager를 통해 얻어오는 방식을 사용했다.
위에서 배운 커넥션 풀을 이용하는 방법으로 커넥션 획득 방식을 변경해보려고 한다.

예를 들어서 애플리케이션 로직에서 DriverManager를 사용해서 커넥션을 획득하다가 HikariCP 같은 커넥션 풀을 사용하도록 변경하면 커넥션을 획득하는 애플리케이션 코드도 함께 변경해야 한다. 의존관계가 DriverManager에서 HikariCP로 변경되기 때문이다. 물론 둘의 사용법도 조금씩 다를 것이다.

스프링과 객체지향을 제대로 공부하신 분이라면, 이 부분을 추상화할 수 있다는 것을 캐치할 것이다.
자바에서는 javax.sql.DataSource라는 인터페이스를 제공하여 추상화하였다.

public interface DataSource {
    Connection getConnection() throws SQLException;
}

커넥션 풀 구현 기술을 변경하고 싶으면 해당 구현체로 갈아끼우기만 하면 된다.

참고로 이전 챕터에서 사용했던 DriverManager는 DataSource 인터페이스를 사용하지 않는다. 따라서 DriverManager는 직접 사용해야 한다. 따라서 DriverManager를 사용하다가 DataSource 기반의 커넥션 풀을 사용하도록 변경하면 관련 코드를 다 고쳐야 한다.

이런 문제를 해결하기 위해 스프링은 DriverManager도 DataSource를 통해서 사용할 수 있도록 DriverManagerDataSource라는 DataSource를 구현한 클래스를 제공한다.

커넥션을 얻는 방법 - DriverManager

@Slf4j
public class ConnectionTest {
    @Test
    void driverManager() throws SQLException {
        Connection con1 = DriverManager.getConnection(URL, USERNAME, PASSWORD);
        Connection con2 = DriverManager.getConnection(URL, USERNAME, PASSWORD);
        log.info("connection={}, class={}", con1, con1.getClass());
        log.info("connection={}, class={}", con2, con2.getClass());
    }
}

커넥션을 얻는 방법 - DriverManagerDataSource로 변경

void dataSourceDriverManager() throws SQLException {
    DriverManagerDataSource dataSource = new DriverManagerDataSource(URL, USERNAME, PASSWORD);
    useDataSource(dataSource);
}

private void useDataSource(DataSource dataSource) throws SQLException {
    Connection con1 = dataSource.getConnection();
    Connection con2 = dataSource.getConnection();
    log.info("connection={}, class={}", con1, con1.getClass());
    log.info("connection={}, class={}", con2, con2.getClass());
}

기존 DriverManager를 사용하던 방식은 커넥션을 획득할 때마다 URL, USERNAME, PASSWORD 같은 파라미터를 계속 전달해야 한다.

반면에 DataSource를 사용하는 방식은 처음 객체를 생성할 때만 필요한 파라미터를 넘겨두고, 커넥션을 획득할 때는 단순히 dataSource.getConnection()만 호출하면 된다.

DataSource가 생성되는 시점에 설정정보를 미리 넣어두기 때문에, DataSource를 사용하는 시점에서는 URL, USERNAME, PASSWORD 같은 파라미터를 신경쓰지 않아도 된다.

DriverManagerDataSource를 도입함으로써 설정과 사용이 분리되었다.

커넥션을 얻는 방법 - 커넥션 풀

@Test
void dataSourceConnectionPool() throws SQLException, InterruptedException {
    // 커넥션 풀링: HikariProxyConnection(Proxy) -> JdbcConnection(Target)
    HikariDataSource dataSource = new HikariDataSource();
    dataSource.setJdbcUrl(URL);
    dataSource.setUsername(USERNAME);
    dataSource.setPassword(PASSWORD);
    dataSource.setMaximumPoolSize(10);
    dataSource.setPoolName("MyPool");
    useDataSource(dataSource);
    Thread.sleep(1000); // 커넥션 풀에서 커넥션 생성 시간 대기
}

DriverManagerDataSource에서 설정과 사용이 분리된 것 처럼, 여기서도 setXXX를 통해 먼저 설정해준 뒤 datasource를 넘겨줘서 사용할 수 있다.

HikariCP 커넥션 풀을 사용한다. HikariDataSource는 DataSource 인터페이스를 구현하고 있다.
커넥션 풀 최대 사이즈를 10으로 지정하고, 풀의 이름을 MyPool이라고 지정했다.
커넥션 풀에서 커넥션을 생성하는 작업은 애플리케이션 실행 속도에 영향을 주지 않기 위해 별도의 쓰레드에서 작동한다. 별도의 쓰레드에서 동작하기 때문에 테스트가 먼저 종료되어 버린다. 예제처럼 Thread.sleep을 통해 대기 시간을 주어야 커넥션 풀에 커넥션이 생성되는 로그를 확인할 수 있다.

실행 결과

(로그 순서는 이해하기 쉽게 약간 수정했다.)

#커넥션 풀 초기화 정보 출력
HikariConfig - MyPool - configuration:
HikariConfig - maximumPoolSize................................10
HikariConfig - poolName................................"MyPool"

#커넥션 풀 전용 쓰레드가 커넥션 풀에 커넥션을 10개 채움
[MyPool connection adder] MyPool - Added connection conn0: url=jdbc:h2:.. user=SA
[MyPool connection adder] MyPool - Added connection conn1: url=jdbc:h2:.. user=SA
[MyPool connection adder] MyPool - Added connection conn2: url=jdbc:h2:.. user=SA
[MyPool connection adder] MyPool - Added connection conn3: url=jdbc:h2:.. user=SA
[MyPool connection adder] MyPool - Added connection conn4: url=jdbc:h2:.. user=SA
...
[MyPool connection adder] MyPool - Added connection conn9: url=jdbc:h2:.. user=SA

#커넥션 풀에서 커넥션 획득1
ConnectionTest - connection=HikariProxyConnection@446445803 wrapping conn0: url=jdbc:h2:tcp://localhost/~/test user=SA, class=class com.zaxxer.hikari.pool.HikariProxyConnection

#커넥션 풀에서 커넥션 획득2
ConnectionTest - connection=HikariProxyConnection@832292933 wrapping conn1: url=jdbc:h2:tcp://localhost/~/test user=SA, class=class com.zaxxer.hikari.pool.HikariProxyConnection

MyPool - After adding stats (total=10, active=2, idle=8, waiting=0)

실행 결과를 분석해보자.

HikariConfig
HikariCP 관련 설정을 확인할 수 있다. 풀의 이름(MyPool)과 최대 풀 수(10)을 확인할 수 있다.

MyPool connection adder
별도의 쓰레드 사용해서 커넥션 풀에 커넥션을 채우고 있는 것을 확인할 수 있다. 이 쓰레드는 커넥션 풀에 커넥션을 최대 풀 수(10)까지 채운다.

그렇다면 왜 별도의 쓰레드를 사용해서 커넥션 풀에 커넥션을 채우는 것일까?

커넥션 풀에 커넥션을 채우는 것은 상대적으로 오래 걸리는 일이다. 애플리케이션을 실행할 때 커넥션 풀을 채울 때까지 마냥 대기하고 있다면 애플리케이션 실행 시간이 늦어진다. 따라서 이렇게 별도의 쓰레드를 사용해서 커넥션 풀을 채워야 애플리케이션 실행 시간에 영향을 주지 않는다.

커넥션 풀에서 커넥션 획득
커넥션 풀에서 커넥션을 획득하고 그 결과를 출력했다. 여기서는 커넥션 풀에서 커넥션을 2개 획득하고 반환하지 않았다. 따라서 풀에 있는 10개의 커넥션 중에 2개를 가지고 있는 상태이다. 그래서 마지막 로그를 보면 사용 중인 커넥션 active=2, 풀에서 대기 상태인 커넥션 idle=8을 확인할 수 있다.

connection이 MaximumPoolSize를 넘어버리면 블럭이 되서 대기상태가 된다. 그리고 30초가 지나면 커넥션이 끊킨다. (풀이 가득찼을 때 기다리고 예외를 터트리는 시간은 설정에서 지정할 수 있다)

보통은 짧게 가져가는게 좋다. 너무 길게 잡으면 고객이 오래 기다려야 한다.

스프링부트 3.1부터는 logback의 로그 레벨을 DEBUG로 설정하면 위 로그를 확인할 수 있다.

리포지토리 코드 개선

public class MemberRepositoryV1 {
    private final DataSource dataSource;

    public MemberRepositoryV1(DataSource dataSource) {
        this.dataSource = dataSource;
    }

    // save()...
    // findById()...
    // update()....
    // delete()....

    private void close(Connection con, Statement stmt, ResultSet rs) {
        JdbcUtils.closeResultSet(rs);
        JdbcUtils.closeStatement(stmt);
        JdbcUtils.closeConnection(con);
    }

    private Connection getConnection() throws SQLException {
        Connection con = dataSource.getConnection();
        log.info("get connection={}, class={}", con, con.getClass());
        return con;
    }
}

JdbcUtils 편의 메서드
스프링은 JDBC를 편리하게 다룰 수 있는 JdbcUtils라는 편의 메서드를 제공한다.
JdbcUtils를 사용하면 커넥션을 좀 더 편리하게 닫을 수 있다.

DataSource 의존관계 주입
외부에서 DataSource를 주입 받아서 사용한다. 이제 직접 만든 DBConnectionUtil을 사용하지 않아도 된다.
DataSource는 표준 인터페이스이기 때문에 DriverManagerDataSource에서 HikariDataSource로 변경되어도 해당 코드를 변경하지 않아도 된다.

테스트 코드를 통해서 dataSource의 의존관계를 주입해보자.

@Slf4j
class MemberRepositoryV1Test {
    MemberRepositoryV1 repository;

    @BeforeEach
    void beforeEach() throws Exception {
        // 기본 DriverManager - 항상 새로운 커넥션 획득
        // DriverManagerDataSource dataSource = new DriverManagerDataSource(URL, USERNAME, PASSWORD);

        // 커넥션 풀링: HikariProxyConnection -> JdbcConnection
        HikariDataSource dataSource = new HikariDataSource();
        dataSource.setJdbcUrl(URL);
        dataSource.setUsername(USERNAME);
        dataSource.setPassword(PASSWORD);
        repository = new MemberRepositoryV1(dataSource);
    }

    // CRUD 테스트 메서드...
    // 생략
}

dataSource에 필요한 정보를 설정해두고, dataSource를 사용하는 repository에 의존관계를 주입해줬다.

DI, 설정과 사용의 분리를 확인할 수 있다.

DataSource의 구현체를 HikariCP에서 DriverManagerDataSource로 바꾸면, 항상 새로운 커넥션이 생성되어서 사용되는 것을 확인할 수 있다. 이 과정에서 구현체, 설정 정보가 바뀌어도 repository의 코드는 전혀 변경하지 않아도 된다. DataSource 인터페이스에만 의존하기 때문이다. 이것이 DataSource를 사용하는 장점이다. (DI + OCP)

참고) 스프링 DB 1편 - 데이터 접근 핵심 원리 강의 | 김영한 - 인프런

[DB Access] 커넥션풀과 데이터소스 이해

02. 커넥션풀과 데이터소스 이해

정리

커넥션 풀 초기화

커넥션 풀의 연결 상태

커넥션 풀 사용

DataSource

커넥션을 얻는 방법 - DriverManager

커넥션을 얻는 방법 - DriverManagerDataSource로 변경

커넥션을 얻는 방법 - 커넥션 풀

실행 결과

실행 결과를 분석해보자.

리포지토리 코드 개선

티스토리툴바