MySQL vs MongoDB 성능 분석
데이터베이스 의사결정을 하기 위한 분석 보고서이다.
Last updated
데이터베이스 의사결정을 하기 위한 분석 보고서이다.
Last updated
프로젝트를 수행하기에 앞서, 적절한 DBMS를 선정하기 위해 2개의 상용 데이터베이스의 성능을 비교하기 위해 지정된 시나리오에 따라 테스트를 진행하였다.
구분
내용
OS
MacOS Mojabe 10.14.5
MySQL
5.7.26
MongoDB
4.0.3
CPU
INTEL I5 7267U 7th Kaby Lake
RAM
8GB
Data Set
나무위키 데이터베이스 덤프(약 7GB)
테스트에 들어가기 앞서, 나무 위키 데이터는 JSON형식의 데이터 셋을 MongoDB에 먼저 덤프를 씌어준 후, 그대로 MySQL에 같은 데이터를 삽입한다.
INT 탐색 테스트를 수행하기 위해 추가로 1 ~ 10만 사이의 랜덤 숫자 25만 개를 넣어주었다.
MySQL, MongoDB 둘 다 검색할 랜덤 숫자 1000개는 동일하다.앞으로 이 숫자를 기반으로 25만 개의 데이터를 검색해보았다. 랜덤 숫자는 약 10만 개 정도로 평균적으로 2,3 개 정도의 중복을 포함하고 있다.
DB
No Index 측정 시간
Index 측정 시간
성능 개선 비율
MySQL
418 sec
0.3123 sec
약 1,393 배
MongoDB
3117 sec
1.0126 sec
약 3,078 배
Index에 무관하게 MySQL이 일관되게 우수한 성능을 보여주었다.
문자열 데이터의 경우, 각각의 DB에서 동치 연산 및 부분 문자열 연산이 존재하기 때문에 모두 테스트를 수행하였다. 동치 비교 분석은 해당 문자열에 대하여 Equal(==) 연산으로 탐색을 수행한 테스트이다.
MySQL의 경우, Text Index를 적용시킬 때 인덱싱시킬 텍스트 값 길이를 반드시 명시해주어야 하기 때문에 해당 길이를 최대 700으로 제한하였다.
DB
No Index 측정 시간
Index 측정 시간
성능 개선 비율
MySQL
18.1485 sec
0.0028 sec
약 9,000배
MongoDB
11.7807 sec
7.7963 sec
약 1.5배
MySQL이 압도적인 성능을 나타내는 것으로 보이나, MySQL은 최대 인덱스 길이를 700자 정도로 제한하였기 때문에, 전문에 인덱스를 적용시킨 유의미한 평가 지표라 판단하기 힘들다. 즉, 유효한 분석 결과는 No Index 측정 시간 뿐이다.
부분 연산을 수행하기 위해 각각의 데이터베이스에 Full Text Index를 적용시킨 후, 한글 및 영어에 빈도수가 다양하게 존재하는 단어 50개를 선정하였다.
부분 문자열 탐색을 수행하기 위하여, 다음과 같은 데이터 셋을 사용하였다.
DB
No Index 측정 시간
Index 측정 시간
성능 개선 비율
단어 소실
MySQL
1347sec
75sec
17.96배
발생
MongoDB
947sec
24sec
39.45배
발생
MongoDB가 MySQL에 비해 전반적으로 우수한 성능을 보여주었다. 그러나 양쪽 다 Full Tabel Scan에 비해 많은 양의 단어가 소실되었으며, 상대적으로 MongoDB에서 더 많은 소실량을 확인할 수 있다.
MongoDB의 Array 내의 연산 및 MySQL의 JOIN 연산의 성능을 비교한다. 해당 테스트의 경우 인덱스를 사용하지 않는다. 동일한 조건에 테스트를 수행하기 위해 아래와 같은 구문을 각 DBMS에서 수행하도록 한다.
post 테이블과 post_contributors의 테이블을 JOIN연산을 수행하였다.
실행 코드
실행 결과
MongoDB의 경우, Array 자료형으로 각 document마다 내장된 contributors 칼럼에 대하여 연산을 수행하였다.
DB
측정 시간
MySQL
9239sec
MongoDB
1670sec
MongoDB가 압도적인 성능을 보여주었다. 예전부터 존재했던 MySQL 내의 JOIN 성능 이슈를 감안하면 타당한 결과라고 생각된다.
여러가지 테스트 상황을 상정하여 고려해보았을 때, SOOJLE 서비스의 DBMS는 NoSQL - MongoDB로 채택하는 것이 이상적인 것으로 판단된다.