1. 트랜잭션
1-1. 트랜잭션(Transaction)이란?
- 하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것.
- 데이터베이스에서 논리적인 작업의 단위가 되며 데이터를 복구하는 작업의 단위도 된다.
1-2. 트랜잭션의 특성
- 원자성
- 원자성(Atomicity)은 트랜잭션을 구성하는 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 한다는 all-or-nothing 방식을 의미한다.
- 일관성
- 일관성(Consistency)은 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미한다.
- 격리성
- 격리성(Isolation)은 고립성이라고도 하는데, 현재 수행 중인 트랜잭션이 완료될 때까지 트랜잭션이 생성한 중간 연산 결과에 따른 트랜잭션들이 접근할 수 없음을 의미한다.
- 지속성
- 지속성(Durability)은 영속성이라고도 하는데 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 어떠한 경우에도 손실되지 않고 영구적이어야 함을 의미한다.
1-3. 트랜잭션의 연산
- commit 연산 : 트랜잭션이 성공적으로 수행되었음을 선언(작업 완료)
- rollback 연산 : 트랜잭션을 수행하는 데 실패했음을 선언(작업 취소)
1-4. 트랜잭션의 상태
- 활동 상태 : 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태를 활동(Active) 상태라고 한다.
- 부분 완료 상태 : 트랜잭션의 마지막 연산이 실행된 직후의 상태를 부분 완료(Partially Committed) 상태라 하는데, 이는 트랜잭션의 모든 연산을 처리한 상태다.
- 완료 상태 : 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태를 완료(Committed) 상태라고 한다.
- 실패 상태 : 하드웨어나 소프트웨어의 문제, 트랜잭션 내부의 오류 등 여러 이유로 인해 장애가 발생하여 트랜잭션의 수행이 중단된 상태를 실패(Failed) 상태라고 한다.
- 철회 상태 : 트랜잭션을 수행하는 데 실패하여 Rollback 연산을 실행한 상태를 철회(Aborted) 상태라고 한다.
2. 장애와 회복
2-1. 장애의 유형
유형 | 설명 | |
트랜잭션 장애 | 의미 | 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태 |
원인 | 트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템 지원의 과다 사용 요구, 처리 대상 데이터의 부재 등 | |
시스템 장애 | 의미 | 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태 |
원인 | 하드웨어 이상으로 메인 메모리에 저장된 정보가 손실되거나 교착 상태가 발생한 경우 등 | |
미디어 장애 | 의미 | 디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태 |
원인 | 디스크 헤드의 손상이나 고장 등 |
2-2. 데이터베이스의 저장 연산
저장장치 | 설명 | |
휘발성 저장 장치 | 의미 | 장애가 발생하면 저장된 데이터가 손실됨 |
예 | 메인 메모리 등 | |
비휘발성 저장 장치 | 의미 | 장애가 발생해도 저장된 데이터가 손실되지 않음, 단, 디스크 헤더 손상 같은 저장 장치 자체에 이상이 발생하면 데이터가 손실될 수 있음 |
예 | 디스크, 자기 테이프, CD/DVD 등 | |
안정 저장 장치 | 의미 | 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법으로, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음. |
2-3. 회복 기법
- 덤프 : 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
- 로그 : 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법
- redo : 가장 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 데이터베이스 상태로 복구
- undo : 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구
3. 병행 제어
3-1. 병행 수행과 병행 제어
- 여러 사용자가 데이터베이스를 동시에 공유할 수 있도록 여러 개의 트랜잭션이 동시에 수행되는 병행 수행(Concurrency)을 지원한다.
- 여러 개의 트랜잭션이 병행 수행되면서 같은 데이터에 접근하여 연산을 실행하더라도, 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 트랜잭션의 수행을 제어하는 것을 병행 제어(Concurrency control) 또는 동시성 제어라고 한다.
3-2. 병행 수행의 문제
- 갱신 분실 : 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것.
- 모순성 : 하나의 트랜잭션이 여러 개의 데이터 변경 연산을 실행할 때 연관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산을 실행함으로써 모순된 결과가 발생하는 것.
- 연쇄 복귀 : 트랜잭션이 완료되기 전에 장애가 발생하여 rollback 연산을 수행하면, 이 트랜잭션이 장애 발생 전에 변경한 데이터를 가져가 변경 연산을 실행한 또 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것이다.
3-3. 트랜잭션 스케줄
- 직렬 스케줄 : 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것.
- 비직렬 스케줄 : 인터리빙 방식을 이용하여 트랜잭션을 병행해서 수행시키는 것.
- 직렬 가능 스케줄 : 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄.
3-4. 병행 제어 기법
병행 제어 기법이란?
- 병행 수행하면서도 정확한 결과를 얻을 수 있는 직렬 가능성을 보장하는 것이다.
로킹 기법 : 병행 수행되는 트랜잭션들이 동일한 데이터에 동시에 접근하지 못하도록 lock과 unlock이라는 2개의 연산을 이용해 제어한다.
- lock 연산 : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
- unlock 연산 : 트랜잭션이 데이터에 대한 독점권을 반환하는 연산
2단계 로킹 규약
- 확장 단계 : 트랜잭션이 lock 연산만 실행할 수 있고, unlock 연산은 실행할 수 없는 단계.
- 축소 단계 : 트랜잭션아 unlock 연산만 실행할 수 있고, lock 연산은 실행할 수 없는 단계.
'Database' 카테고리의 다른 글
Chapter 09. 정규화 (0) | 2019.11.20 |
---|---|
Chapter 08. 데이터베이스 설계 (0) | 2019.11.14 |
Chapter 07. 데이터베이스 언어 SQL (0) | 2019.10.18 |
Chapter 06. 관계 데이터 연산 (0) | 2019.10.17 |
Chapter 05. 관계 데이터 모델 (0) | 2019.10.17 |