2. 데이터 입, 출력 구현
데이터베이스(Database)
- 공동으로 사용될 데이터를 중복을 배제하여 통합하고, 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터
DBMS(DataBase Management System; 데이터베이스 관리 시스템)
- 사용자의 요구에 따라 정보를 생성해 주고,, 데이터베이스를 관리해 주는 소프트웨어
- 필수 기능 3가지
1) 정의 : 데이터의 형(Type)과 구조에 대한 정의, 이용 방식, 제약조건 등을 명시
2) 조작 : 데이터 검색, 갱신, 삽입, 삭제 등을 위해 인터페이스 수단을 제공
3) 제어 : 데이터의 무결성, 보안, 권한 검사, 병행 제어를 제공
스키마(Schema)
데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 기술한 것
종류 : 외부 스키마, 개념 스키마, 내부 스키마
1) 외부 스키마
- 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것
2) 개념 스키마
- 데이터베이스의 전체적인 논리적 구조
- 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 데이터베이스, 하나만 존재함
3) 내부 스키마
- 물리적 저장장치의 입장에서 본 데이터베이스 구조
- 실제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타냄
데이터베이스 설계 시 고려사항
- 무결성, 일관성, 회복, 보안, 효율성, 데이터베이스 확장
데이터베이스 설계 순서
-요구 조건 분석 - 개념적 설계 - 논리적 설계 - 물리적 설계 – 구현
1) 요구 조건 분석
- 데이터베이스를 사용할 사람들로부터 필요한 용도를 파악하는 것
2) 개념적 설계 (정보 모델링, 개념화)
- 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
- E-R 다이어그램
- DBMS에 독립적인 개념 스키마 설계
3) 논리적 설계 (데이터 모델링)
- 현실 세계에서 발생하는 자료를 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
4) 물리적 설계 (데이터 구조화)
- 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정
5) 데이터베이스 구현
- 논리적 설계와 물리적 설계에서 도출된 데이터베이스 스키마를 파일로 생성하는 과정
데이터 모델
- 현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형
- 데이터 모델 구성 요소 : 개체, 속성, 관계
- 데이터 모델 종류 : 개념적 데이터 모델, 논리적 데이터 모델, 물리적 데이터 모델
- 데이터 모델에 표시할 요소 : 구조, 연산, 제약조건
종류
1) 개념적 데이터 모델
- 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
- E-R 모델
2) 논리적 데이터 모델
- 개념적 구조를 컴퓨터 세계의 환경에 맞도록 변환하는 과정
요소
1) 구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질 표현
2) 연산(Operation) : 데이터 베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
3) 제약 조건(Constraint): 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건
구성요소
1) 개체(Entity)
- 데이터베이스에 표현하려는 것으로, 사람이 생각하는 개념이나 정보 단위 같은 현실 세계의 대상체
- 독립적으로 존재하거나 그 자체로서도 구별이 가능, 유일한 식별자에 의해 식별됨
- 다른 개체와 하나 이상의 관계가 있다.
2) 속성(Attribute)
- 데이터베이스를 구성하는 가장 작은 논리적 단위
- 속성의 수 : 디그리(Degree) / 차수
3) 관계(Relationship)
- 개체와 개체 사이의 논리적인 연결
- 형태 : 일 대 일 (1 : 1) , 일 대 다 (1 : N), 다 대 다 (N : N)
- 종류 : 종속 관계, 중복 관계, 재귀 관계, 배타 관계
E-R(Entity-Relationship, 개체-관계) 모델
개체와 개체 간의 관계를 기본 요소로 이용하여 현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현하기 위한 방법
개념적 데이터 모델의 가장 대표적인 것
개체 타입과 관계 타입을 이용해 개념적으로 표현
데이터를 개체, 관계, 속성으로 묘사
E-R 다이어그램으로 표현, 1:1, 1:N, N:M 등의 관계 유형을 제한 없이 표현 가능
E-R 다이어그램
사각형 : 개체(Entity) 타입
마름모 : 관계(Relationship) 타입
타원 : 속성(Attribute)
이중 타원 : 다중값 속성(복합 속성)
밑줄 타원 : 기본키 속성
복수 타원 : 복합 속성
관계 : 1:1, 1:N, N:M 등의 개체 간 관계에 대한 대응수를 선 위에 기술함
선, 링크 : 개체 타입과 속성을 연결
관계형 데이터베이스
2차원적인 표(Table)를 이용해서 데이터 상호 관계를 정의하는 데이터베이스
장점 : 간결하고 보기 편리하며, 다른 데이터베이스로의 변환이 용이
단점 : 성능이 다소 떨어짐
릴레이션 : 데이터들을 표의 형태로 표현한 것
튜플 : 릴레이션을 구성하는 각각의 행 / 튜플의 수 : 카디널리티, 기수, 대응수
속성 : 데이터베이스를 구성하는 가장 작은 논리적 단위 / 속성의 수 : 디그리, 차수
도메인 : 하나의 애트리뷰트가 취할 수 있는 같은 타입의 원자 값들의 집합
키(Key)
데이터베이스에서 조건에 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성
종류 : 후보키, 기본키, 대체키, 슈퍼키, 외래키
1) 후보키 (Candidate Key)
- 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
- 기본키로 사용할 수 있는 속성들
- 유일성과 최소성을 모두 만족시켜야 한다.
유일성(Unique) : 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함
최소성(Minimality) : 키를 구성하는 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성되어야 함
2) 기본키(Primary Key)
- 후보키 중에서 특별히 선정된 주키
- 중복된 값을 가질 수 없다
- 특정 튜플을 유일하게 구별할 수 있는 속성
- NULL값을 가질 수 없다.
3) 대체키(Alternate Key) (보조키)
후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키
4) 슈퍼키 (Super Key)
- 속성들의 집합으로 구성된 키
- 모든 튜플 중 슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않는다
- 유일성은 만족하지만, 최소성은 만족하지 못한다.
5) 외래키 (Foreign Key)
- 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
무결성(Integrity)
데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제값이 일치하는 정확성
1) 개체 무결성
- 기본 테이블의 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없다는 규정
2) 참조 무결성
- 외래키 값은 Null이거나 참조 릴레이션의 기본키 값과 동일해야함
3) 도메인 무결성
- 주어진 속성 값이 정의된 도메인에 속한 값이어야 한다는 규정
4) 사용자 정의 무결성
- 속성 값들이 사용자가 정의한 제약조건에 만족되어야 한다는 규정
5) NULL 무결성
- 릴레이션의 특정 속성 값이 NULL이 될 수 없도록 하는 규정
6) 고유 무결성
- 릴레이션의 특정 속성에 대해 각 튜플이 갖는 속성값들이 서로 달라야 한다는 규정
7) 키 무결성
- 하나의 릴레이션에는 적어도 하나의 키가 존재해야 한다는 규정
8) 관계 무결성
- 어느 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정
관계대수
- 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어
순수 관계 연산자
Select : 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산 / 기호 : σ(시그마)
Project : 주어진 릴레이션에서 속성 리스트 (Attribute List)에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산 / 기호 : π(파이)
Join : 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산 / 기호 : ▷◁
Division : X ⊃ Y 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산 / 기호 : ÷
일반 집합 연산자
- 수학적 집합 이론에서 사용하는 연산자
- 합집합(UNION, U) : 두 릴레이션에 존재하는 튜플의 합집합을 구하되, 결과로 생성된 릴레이션에서 중복되는 튜플은 제거되는 연산
- 교집합(INTERSECTION, ∩) : 두 릴레이션에 존재하는 튜플의 교집합을 구하는 연산
- 차집합(DIFFERENCE, -) : 두 릴레이션에 존재하는 튜플의 차집합을 구하는 연산
- 교차곱(CARTESIAN PRODUCT, X) : 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산
이상(Anomaly)
테이블에서 데이터의 중복이 발생하고, 이 중복(Redundancy)으로 문제가 발생하는 현상
삽입 이상(Insertion Anomaly) : 테이블에 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들로 인해 삽입할 수 없게 되는 현상
삭제 이상(Deletion Anomaly) : 테이블에서 한 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는, 즉 연쇄 삭제가 발생하는 현상
갱신 이상(Update Anomaly) : 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상
정규화(Normalization)
테이블의 속성들의 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정
- 1NF : 모든 도메인이 원자 값으로만 구성
- 2NF : 기본키가 아닌 속성이 기본키에 대한 완전 함수적 종속을 만족 / 부분적 함수 종속을 제거한 정규형
- 3NF : 기본키가 아닌 모든 속성이 기본키에 대해 이행적 함수 종속 관계를 만족하지 않는 정규형
- BCNF : 모든 결정자가 후보키인 정규형 / 종속성 보존 XX
- 4NF : 다치 종속이 성립하는 경우, R의 모든 속성이 A에 함수적 종속 관계를 만족
- 5NF : 모든 조인종속이 R의 후보키를 통해서만 성립되는 정규형
반정규화(Denormalization)
정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위
시스템의 성능 향상, 관리 효율성은 증가하지만 데이터의 일관성 및 정합성이 저하될 수 있다.
반 정규화의 방법 : 테이블 통합, 테이블 분할, 중복 테이블 추가, 중복 속성 추가
테이블 통합
두 개의 테이블이 조인되어 사용하는 경우가 많을 경우 성능 향상을 위해 아예 하나의 테이블로 만들어 사용하는 것
테이블 분할
테이블을 수직 또는 수평으로 분할하는 것
수평 분할 : 레코드를 기준으로 테이블을 분할하는 것
수직 분할 : 속성을 기준으로 테이블을 분할하는 것
중복 테이블 추가
작업의 효율성을 향상시키기 위해 테이블을 추가하는 것
중복 속성 추가
조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것
시스템 카탈로그(System Catalog)
- 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스
메타 데이터(Meta-Data)
- 시스템 카탈로그에 저장된 정보
데이터 디렉터리(Data Directory)
- 데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 관리 유지하는 시스템
트랜잭션(Transaction)
- 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산들
- 데이터베이스 시스템에서 병행 제어 및 회복 작업 시 처리되는 작업의 논리적 단위로 사용된다
- 트랜잭션의 특성
1) Atomicity(원자성)
2) Consistency(일관성)
3) Isolation(독립성, 격리성, 순차성)
4) Durability(영속성, 지속성)
CRUD 분석
- 프로세스와 테이블 간에 CRUD 매트릭스를 만들어서 트랜잭션을 분석하는 것
트랜잭션 분석
CRUD 매트릭스를 기반으로 테이블에 발생하는 트랜잭션 양을 분석하여 테이블에 저장되는 데이터의 양을 유추하고 이를 근거로 DB의 용량 산정 및 구조의 최적화 목적
인덱스(Index)
데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조
뷰(View)
하나 이상의 기본 테이블로부터 유도된, 가상 테이블
장점
1) 논리적 데이터 독립성을 제공
2) 동일 데이터에 대해 동시에 여러 사용자의 상이한 응용이나 요구를 지원해 줌
3) 사용자의 데이터 관리를 간단하게 해 줌
4) 접근 제어를 통한 자동 보안이 제공됨
단점
1) 독립적인 인덱스를 가질 수 없음
2) 뷰의 정의를 변경할 수 없음
3) 뷰로 구성된 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따름
클러스터(Cluster)
동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
파티션(Partition)
- 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
- 범위 분할, 해시 분할, 조합 분할
클러스터링(Clustering)
- 두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
- 고가용성 클러스터링, 병렬 처리 클러스터링
RTO/RPO
- RTO : 비상사태 또는 업무 중단 시점으로부터 복구되어 가동될 때까지의 소요 시간을 의미
- RPO : 비상사태 또는 업무 중단 시점으로부터 데이터를 복구할 수 있는 기준점을 의미
암호화(Encryption) : 암호화되지 않은 평문을 암호문으로 바꾸는 과정
복호화(Decryption) : 암호문을 원래의 평문으로 바꾸는 과정
암호화 기법 : 개인키 암호 방식, 공개키 암호 방식
접근통제 : 데이터가 저장된 객체와 이를 사용하려는 주체 사이의 정보흐름을 제한하는 것
- 접근통제 3요소 : 접근통제 정책, 접근통제 메커니즘,, 접근통제 보안모델
- 접근통제 기술
1) 임의 접근통제(DAC, Discretionary Access Control)
- 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여하는 방식
- 데이터 소유자가 접근통제 권한을 지정하고 제어함
- 객체를 생성한 사용자가 생성된 객체에 대한 모든 권한을 부여받고, 부여된 권한을 다른 사용자에게 허가할 수도 있음
2) 강제 접근통제(MAC, Mandatory Access Control)
- 주체와 객체의 등급을 비교하여 접근 권한을 부여하는 방식
- 시스템이 접근통제 권한을 지정함
- 데이터베이스 객체별로 보안 등급을 부여할 수 있음
- 사용자별로 인가 등급을 부여할 수 있음
3) 역할기반 접근통제(PBAC, Role Based Access Control)
- 사용자의 역할에 따라 접근 권한을 부여하는 방식
- 중앙관리자가 접근통제 권한을 지정함
- 임의 접근통제와 강제 접근통제의 단점을 보완
- 다중 프로그래밍 환경에 최적화된 방식
스토리지(Storage)
- 대용량의 데이터를 저장하기 위해 서버와 저장장치를 연결하는 기술
DAS(Direct Attached Storage)
서버와 저장장치를 전용 케이블로 직접 연결하는 방식
NAS(Network Attached Storage)
서버와 저장장치를 네트워크를 통해 연결하는 방식
SAN(Storage Area Network)
서버와 저장장치를 연결하는 전용 네트워크를 별도로 구성하는 방식
자료구조
1) 배열(Array)
- 크기와 형이 동일한 자료들이 순서대로 나열된 자료의 집합
2) 연속 리스트(Contiguous List)
- 연속되는 기억장소에 저장되는 자료 구조
3) 연결 리스트(Linked List)
- 자료들을 임의의 기억공간에 기억시키되, 노드의 포인터 부분을 이용하여 서로 연결시킨 자료 구조
4) 스택(Stack)
- 리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료 구조
5) 큐(Queue)
- 리스트의 한쪽에서는 삽입 작업, 다른 한쪽에서는 삭제 작업이 이루어지는 자료 구조
6) 그래프(Graph)
- 정점과 간선의 두 집합으로 이루어지는 자료 구조
7) 트리(Tree)
- 정점과 선분을 이용하여 사이클을 이루지 않도록 구성한 그래프의 특수한 형태
8) 이진 트리
- 차수가 2 이하인 노드들로 구성된 트리
- Preorder : Root -> Left -> Right
- Inorder : Left -> Root -> Right
- Postorder : Left -> Right -> Root
- 전위 표기법(PreFix) : 연산자 -> Left -> Right
- 중위 표기법(InFix) : Left -> 연산자 -> Right
- 후위 표기법(PostFix) : Left -> Right -> 연산자
정렬
1) 삽입 정렬(Insertion Sort) : 이미 순서화된 파일에 새로운 하나의 레코드를 순서에 맞게 삽입시켜 정렬
2) 선택 정렬(Selection Sort) : 최솟값을 찾아 첫 번째 레코드 위치에 놓고, 나머지 (n-1) 개 중에서 다시 최솟값을 찾아 두 번째 레코드 위치에 놓는 방식을 반복하여 정렬하는 방식
3) 버블 정렬(Bubbled Sort) : 인접한 두 개의 레코드 키 값을 비교하여 그 크기에 따라 레코드 위치를 서로 교환하는 정렬
4) 쉘 정렬(Shell Sort) : 매개변수의 값으로 서브파일을 구성하고, 각 서브파일을 Insertion 정렬 방식으로 순서 배열하는 정렬
5) 퀵 정렬(Quick Sort) : 키를 기준으로 작은 값은 왼쪽에, 큰 값은 오른쪽 서브파일로 분해시키는 방식으로 정렬
6) 힙 정렬(Heap Sort) : 전이진 트리를 이용한 정렬
7) 2-Way 합병 정렬(Merge Sort) : 이미 정렬되어 있는 두 개의 파일을 한 개의 파일로 합병하는 정렬 방식
8) 기수 정렬(Radix Sort) : Queue를 이용하여 자릿수별로 정렬
'자격증 > 정보처리기사' 카테고리의 다른 글
[정보처리기사] 실기 정리 - 8. SQL 응용 (0) | 2023.06.23 |
---|---|
[정보처리기사] 실기 정리 - 6. 화면 설계 / 7. 애플리케이션 테스트 관리 (0) | 2023.03.07 |
[정보처리기사] 실기 정리 - 5. 인터페이스 구현 (0) | 2023.03.03 |
[정보처리기사] 실기 정리 - 3. 통합구현 / 4. 서버 프로그램 구현 (4) | 2023.03.02 |
[정보처리기사] 실기 정리 - 1. 요구사항 확인 (0) | 2023.02.24 |