Database

Chapter 01. 데이터베이스 기본 개념

JinWooHong Dev 2019. 9. 26. 18:04
  • 1. 데이터베이스의 필요성

1-1. 데이터와 정보

데이터(Data)란?

-현실 세계에서 단순히 관찰하거나 측정하여 수집한 fact나 value.

-자료라고도 한다.

 

정보(Information)란?

-데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물.

 

정보 처리(Information processing)이란?

-데이터에서 정보를 추출하는 과정 또는 방법

 

예시) 쇼핑몰 주문 내역 -> 제품별 총 판매액

 예시와 같이 정보 처리 과정을 통해 얻은 정보를 바탕으로 이듬해 제품 판매 전략을 세우는 데 활용할 수 있듯이 수집한 데이터를 효율적으로 저장했다가 필요할 때 언제든 사용할 수 있어야 한다. 유용하게 활용할 수 있는 정보를 정확히 추출할 수 있도록 데이터를 대신 관리해주는 역할은 데이터베이스가 담당한다.

1-2. 정보 시스템과 데이터베이스

정보 시스템(Information System)이란?

-조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단.

-정보 시스템은 사용 목적에 따라 저장되는 데이터의 내용도 다르고 부르는 이름도 다르다.

   예1) 경영 정보 시스템(MIS : Management Information System) : 기업의 경영 관리에 필요한 의사 결정용 정보 시스템.

   예2) 의사 결정 지원 시스템(DSS : Decision Support System) : 복합적이고 광범위한 의사 결정을 위해 사용되는 정보 시스템.  

 

  • 2. 데이터베이스의 정의와 특징

2-1. 데이터베이스의 정의

데이터베이스(DB : DataBase)란?

-특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영' 데이터의 집합.

-데이터베이스는 공유 데이터(shared data) : 데이터베이스는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야 하는 공용 데이터다.

-데이터베이스는 통합 데이터(Integrated data) : 데이터베이스는 데이터 중복성(data redundancy), 즉 똑같은 데이터가 여러 개 존재하는 것을 허용하지 않는다.

-데이터베이스는 저장 데이터(stored data) : 데이터베이스의 데이터는 주로 컴퓨터가 처리하므로, 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야 한다.

-데이터베이스는 운영 데이터(operational data) : 데이터베이스는 일시적으로 사용하고 마는 것이 아닌, 지속적으로 유지해야 하는 데이터다.

 

2-2. 데이터베이스의 특징

-데이터베이스는 실시간 접근(real-time accessibility)이 가능하다

-데이터베이스는 계속 변화(continuous evolution)한다

-데이터베이스는 동시 공유(concurrent sharing)가 가능하다

-데이터베이스는 내용으로 참조(content reference)가 가능하다

 

  • 3. 데이터와 데이터베이스

일반적으로  데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있다.

3-1. 정형 데이터

-정형 데이터(structed data)는 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터다.

-표 안에서 행과 열에 의해 지정된 각 칸에 데이터를 저장하는 엑셀의 스프레드시트, 관계 데이터베이스의 테이블이 대표적인 예다.

3-2. 반정형 데이터

-반정형 데이터(semi-structed data)는 구조에 따라 저장된 데이터이지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재한다. 따라서 구조를 파악하는 파싱(parsing) 과정이 필요하다.

-보통 파일 형태로 저장되며 웹에서 데이터를 교환하기 위해 작성하는 HTML, XML, JSON 문서나 웹 로그, 센서 데이터 등인 대표적인 예다.

내용과 함께 설명된 데이터 구조를 스키마(schema)라고도 하지만 메타 데이터(metadata)라고도 한다.

3-3. 비정형 데이터

-비정형 데이터(unstructed data)는 정해진 구조가 없이 저장된 데이터다.

-워드나 PDF 문서와 같은 멀티미디어 데이터가 대표적인 예다.