Tech Log

[DataBase] 트랜잭션 본문

Computer Science/DataBase

[DataBase] 트랜잭션

yuhee kim 2023. 2. 18. 01:37

트랜잭션

데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위.

여러 개의 쿼리들을 하나로 묶는 단위.

트랜잭션의 특징은 원자성, 일관성, 독립성, 지속성이 있으며 한꺼번에 ACID 특징이라고 한다.

*쿼리 : 데이터베이스에 접근하는 방법. 데이터베이스에 정보를 요청하는 것.

 

원자성(atomicity)

트랜잭션과 관련된 일이 모두 수행됐거나 되지 않았거나를 보장하는 것.

트랜잭션 내의 모든 수정 작업이 수행되거나 수정 작업이 하나도 수행되지 않는다.

 

예를 들어 트랜잭션을 커밋했는데 문제가 발생하여 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장하는 것.

예를 들어 1000만원을 가진 A가 0원을 가진 B에게 500만원을 이체한다고 한다.

그 결과 A는 500만원, B는 500만원을 가진다.

이 과정 중에서 데이터베이스 사용자는 이 과정을 볼 수도 참여할 수도 없다.

모두 끝난 이후의 상황만 보는 것이다.

 

여기서 이 작업을 취소한다고 했을 때 A는 다시 1000만원 B는 0원을 가져야 한다.

돈을 주고 받는 과정 중에서 일부 operation만 적용되어서 A는 500만원, B는 0원이 되지 않는 것을 의미한다.

 

또한, 트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 안된다.

만약 호출한다면 롤백이 일어났을 때 어떻게 해야 할지에 대한 해결 방법이 있어야 한다.

그리고 트랜잭션 전파를 신경 써서 관리해야 한다.

 

커밋과 롤백

커밋(commit)

여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어.

트랜잭션 단위로 수행되며 변경된 내용이 영구저장되는 것.

커밋이 수행됐다를 하나의 트랜잭션이 성공적으로 수행됐다고도 말한다.

 

출처 : 면접을 위한 CS 전공지식 노트(2022)

위 그림처럼 update, insert, delete의 쿼리가 하나의 트랜잭션 단위로 수행되고 DB에 영구적으로 저장된다.

 

롤백(rolback)

트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 돌리는 일.

 

출처 : 면접을 위한 CS 전공지식 노트(2022)

에러나 여러 이슈 때문에 트랜잭션 전으로 돌려야할 때 사용하는 것이 롤백이다.

 

커밋과 롤백으로 데이터의 무결성이 보장된다.

데이터 변경 전에 변경 사항을 쉽게 확인할 수 있고 해당 작업을 그룹화할 수 있다.

 

트랜잭션 전파

트랜잭션을 수행할 때 커넥션 객체를 넘겨서 수행해야 한다. 이를 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 말한다.

*커넥션 : 애플리케이션과 데이터베이스의 연결. DB와 연결하기 위해 사용하는 것이 커넥션 객체다.

 

일관성(consistency)

허용된 방식으로만 데이터를 변경해야 하는 것.

데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야 한다.

정해진 조건, 규칙에 따라 데이터를 변경해야 하는 것이다.

 

격리성(isolation)

트랜잭션 수행 시 서로 끼어들지 못하는 것.

트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 한다.

데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 한다.

 

격리성은 여러 개의 격리 수준으로 나뉜다.

출처 : 면접을 위한 CS 전공지식 노트(2022)

*동시성 : 여러 일을 동시에 실행하는 것. 트랜잭션의 각 쿼리문들이 트랜잭션의 순서에 상관없이 동시에 실행되는 것.

 

격리 수준에 따라 발생하는 현상

격리 수준에 따라 발생하는 현상은 팬텀 리드, 반복 가능하지 않은 조회, 더티 리드가 있다.

 

팬텀 리드(phantom read)

한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우를 말한다.

 

반복 가능하지 않은 조회(non-repeatable read)

한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생했는데, 그 값이 서로 다른 경우.

팬텀 리드와 다른 점은 반복 가능하지 않은 조회는 행 값이 달라질 수도 있는데, 팬텀 리드는 다른 행이 선택될 수도 있다는 것이다.

 

더티 리드(dirty read)

한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 커밋되지 않은 행의 데이터를 읽을 수 있을 때 발생한다.

반복 가능하지 않은 조회와 유사하다.

 

격리 수준

격리 수준은 SERIALIZABLE, REPEATABLE_READ, READ_COMMITTED, READ_UNCOMMITTED가 있다.

출처 : hjoon.log(https://velog.io/@guswns3371/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4-%ED%8A%B8%EB%9E%9C%EC%9E%AD%EC%85%98-%EA%B2%A9%EB%A6%AC%EC%88%98%EC%A4%80)

 

SERIALIZABLE

트랜잭션을 순차적으로 진행시키는 것.

트랜잭션이 완료될 때까지 다른 사용자가 데이터베이스에 행을 삽입하거나 업데이트할 수 없도록 한다.

 

여러 트랜잭션이 동시에 같은 행에 접근할 수 없다.

매우 엄격한 격리 수준으로 해당 행에 대해 격리시키고, 이후 트랜잭션이 이 행에 대해 일어난다면 기다려야 한다.

따라서 교착 상태가 일어날 확률이 높고 가장 성능이 안좋은 격리 수준이다.

 

REPEATABLE_READ

하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않는다.

이후에 추가된 행이 발견될 수 있다.

 

READ_COMMITTED

다른 트랜잭션이 커밋하지 않은 정보는 읽을 수 없다. 커밋 완료된 데이터에 대해서만 조회를 허용한다.

하지만 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있다.

따라서 다시 읽을 때 다른 내용이 발견될 수 있다.

 

가장 많이 사용되는 격리 수준이다.

MySQL8.0, PostgreSQL, SQL Server, 오라클에서 기본값으로 설정되어 있다.

 

READ_UNCOMMITTED

가장 낮은 격리 수준을 가진다.

데이터 무결성을 위해 사용하지 않는 것이 이상적이다.

하나의 트랜잭션이 커밋되기 이전에 다른 트랜잭션에 노출될 수 있는 문제가 있다.

 

다만 거대한 양의 데이터를 어림잡아 집계하는 데는 사용하면 좋다.

 

지속성(durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것.

데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복 기능이 있어야 함을 의미한다.

이를 위해 데이터베이스는 체크섬, 저널링, 롤백 등의 기능을 제공한다.

 

*체크섬 : 중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호한다.

*저널링 : 파일 시스템 또는 데이터베이스 시스템에 변경 사항을 커밋하기 전에 로깅하는 것(트랜잭션 등 변경 사항에 대한 로그를 남기는 것)

 

무결성

데이터의 정확성, 일관성, 유효성을 유지시키는 것.

무결성이 유지돼야 데이터베이스에 저장된 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는지에 대한 신뢰가 생긴다.

 

무결성의 종류는 다음과 같다.

  • 개체 무결성 : 기본키로 선택된 필드는 빈 값을 허용하지 않는다.
  • 참조 무결성 : 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 한다.
  • 고유 무결성 : 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가진다.
  • NULL 무결성 : 특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건.

 

 

참조
  • 주홍철, 면접을 위한 CS 전공지식 노트, 길벗(2022)

'Computer Science > DataBase' 카테고리의 다른 글

[DataBase] 인덱스  (0) 2023.02.25
[DataBase] 데이터베이스의 종류  (0) 2023.02.25
[DataBase] 정규화(Normalization)  (0) 2023.02.18
[DataBase] ERD(Entity Relationship Diagram)  (0) 2023.02.17
[DataBase] 키(Key)  (0) 2023.02.14
Comments