MySQL vs MongoDB 성능 분석

데이터베이스 의사결정을 하기 위한 분석 보고서이다.

개요

프로젝트를 수행하기에 앞서, 적절한 DBMS를 선정하기 위해 2개의 상용 데이터베이스의 성능을 비교하기 위해 지정된 시나리오에 따라 테스트를 진행하였다.

테스트 환경

구분

내용

OS

MacOS Mojabe 10.14.5

MySQL

5.7.26

MongoDB

4.0.3

CPU

INTEL I5 7267U 7th Kaby Lake

RAM

8GB

Data Set

나무위키 데이터베이스 덤프(약 7GB)

데이터 셋 출처

나무위키:데이터베이스 덤프

데이터 셋 삽입

테스트에 들어가기 앞서, 나무 위키 데이터는 JSON형식의 데이터 셋을 MongoDB에 먼저 덤프를 씌어준 후, 그대로 MySQL에 같은 데이터를 삽입한다.

INT 탐색 테스트를 수행하기 위해 추가로 1 ~ 10만 사이의 랜덤 숫자 25만 개를 넣어주었다.

INT 성능 비교

MySQL, MongoDB 둘 다 검색할 랜덤 숫자 1000개는 동일하다.앞으로 이 숫자를 기반으로 25만 개의 데이터를 검색해보았다. 랜덤 숫자는 약 10만 개 정도로 평균적으로 2,3 개 정도의 중복을 포함하고 있다.

MySQL - No Index

실행 코드

분석 결과

MongoDB - No Index

실행 코드

분석 결과

MySQL - Index

실행 코드

분석 결과

MongoDB - Index

실행 코드

분석 결과

분석 결과

DB

No Index 측정 시간

Index 측정 시간

성능 개선 비율

MySQL

418 sec

0.3123 sec

약 1,393 배

MongoDB

3117 sec

1.0126 sec

약 3,078 배

Index에 무관하게 MySQL이 일관되게 우수한 성능을 보여주었다.

STRING 동치 비교 분석

문자열 데이터의 경우, 각각의 DB에서 동치 연산 및 부분 문자열 연산이 존재하기 때문에 모두 테스트를 수행하였다. 동치 비교 분석은 해당 문자열에 대하여 Equal(==) 연산으로 탐색을 수행한 테스트이다.

MySQL - No Index

실행 코드

분석 결과

MongoDB - No Index

실행 코드

분석 결과

MySQL - Index

분석 결과

MySQL의 경우, Text Index를 적용시킬 때 인덱싱시킬 텍스트 값 길이를 반드시 명시해주어야 하기 때문에 해당 길이를 최대 700으로 제한하였다.

MongoDB - Index

분석 결과

분석 결과

DB

No Index 측정 시간

Index 측정 시간

성능 개선 비율

MySQL

18.1485 sec

0.0028 sec

약 9,000배

MongoDB

11.7807 sec

7.7963 sec

약 1.5배

MySQL이 압도적인 성능을 나타내는 것으로 보이나, MySQL은 최대 인덱스 길이를 700자 정도로 제한하였기 때문에, 전문에 인덱스를 적용시킨 유의미한 평가 지표라 판단하기 힘들다. 즉, 유효한 분석 결과는 No Index 측정 시간 뿐이다.

STRING 부분 연산

부분 연산을 수행하기 위해 각각의 데이터베이스에 Full Text Index를 적용시킨 후, 한글 및 영어에 빈도수가 다양하게 존재하는 단어 50개를 선정하였다.

부분 문자열 탐색을 수행하기 위하여, 다음과 같은 데이터 셋을 사용하였다.

MySQL - No Index

실행 코드

분석 결과

MongoDB - No Index

실행 코드

분석 결과

MySQL - Index

실행 코드

분석 결과

MongoDB - Index

실행 코드

분석 결과

분석 결과

DB

No Index 측정 시간

Index 측정 시간

성능 개선 비율

단어 소실

MySQL

1347sec

75sec

17.96배

발생

MongoDB

947sec

24sec

39.45배

발생

MongoDB가 MySQL에 비해 전반적으로 우수한 성능을 보여주었다. 그러나 양쪽 다 Full Tabel Scan에 비해 많은 양의 단어가 소실되었으며, 상대적으로 MongoDB에서 더 많은 소실량을 확인할 수 있다.

Array/Join 탐색

MongoDB의 Array 내의 연산 및 MySQL의 JOIN 연산의 성능을 비교한다. 해당 테스트의 경우 인덱스를 사용하지 않는다. 동일한 조건에 테스트를 수행하기 위해 아래와 같은 구문을 각 DBMS에서 수행하도록 한다.

"ㅁㅁㅁ"의 단어를 포함하면서(AND), "XXX" 혹은(OR) "XXXX"가 수정한 포스트를 찾아라

MySQL(JOIN)

post 테이블과 post_contributors의 테이블을 JOIN연산을 수행하였다.

실행 코드

실행 결과

MongoDB(Array)

MongoDB의 경우, Array 자료형으로 각 document마다 내장된 contributors 칼럼에 대하여 연산을 수행하였다.

실행 코드

실행 결과

분석 결과

DB

측정 시간

MySQL

9239sec

MongoDB

1670sec

MongoDB가 압도적인 성능을 보여주었다. 예전부터 존재했던 MySQL 내의 JOIN 성능 이슈를 감안하면 타당한 결과라고 생각된다.

결과 해석

여러가지 테스트 상황을 상정하여 고려해보았을 때, SOOJLE 서비스의 DBMS는 NoSQL - MongoDB로 채택하는 것이 이상적인 것으로 판단된다.

Last updated