정보처리기사 문제

[수제비] 데이터 입출력 구현

양상추상츄 2022. 8. 31. 00:13

* 논리데이터 모델링 속성

개체 - 관리할 대상이 되는 실체

속성 - 관리할 정보의 구체적 항목

관계 - 개체 간의 대응 관계

 

* 데이터베이스 정규화 단계

- 모든 결정자가 후보 키가 되도록 하여 결정자 함수 종속성을 제거하는 단계

BCNF 코드 정규형

- 테이블 내의 속성값을 원자값으로 구성하는 단계이다.

1정규형

 

* 파티션의 유형

- 레인지 파티셔닝

- 해시 파티셔닝

- 리스트 파티셔닝

- 컴포지트 파티셔닝

- 라운드로빈 파티셔닝

 

* 개체-관계(E-R) 모델의 개념

현실에 존재하는것을 데이터와 그것들의 관계를 사람이 이해하기 편하게 표현

개체, 속성, 관계로 기술한다.

 

* 레인지파티셔닝의 개념

손쉬운 관리 기법을 제공하여 관리 시간의 단축이 가능

우편번호, 일별, 월별, 분기별 등의 데이터에 적합

 

* 데이터베이스 정의

통합된 데이터 - 자료의 중복을 배제

저장된 데이터

운영 데이터 - 조직의 업무를 수행하는데 필요한 데이터

공용 데이터 - 여러 애플리케이션, 시스템들이 공동으로 사용하는 데이터

 

* 빅데이터의 개념

조직에서 주어진 시간, 비용내에 처리 가능한 데이터 범위를 넘어선 페타바이트 크기의 비정형 데이터

 

* 빅데이터의 특성

Volume (양), Variety (다양성), Velocity (속도)

 

* NoSQL의 개념

RDBMS와 다른 DBMS를 자칭, 수평적으로 확장이 가능하고 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없다.

 

* NoSQL의 유형

Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DB

테이블 기반, 조인 미 지원, 컬럼 기반, 구글의 Bigtable기반으로 표현

대표적으로 HBase, Cassandra 등이 있음

-> Column Famliy Data Store

(Key-value store, Document store, graph store)

 

* 데이터 마이닝

대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법

-> 텍스트 마이닝

 

* 온톨로지 개념

세상의 모든 개념을 속성과 관계로 표현, 컴퓨터가 이해하기 쉽게 서술해 놓은것

 

* 반정규화 기법(De-Nomalization)

1:1관계, 1:M 관계를 통합하여 조인 횟수를 줄여 성능을 향상

슈퍼타입/서브타입 테이블 통합을 통해 성능 향상

-> 테이블 통합

 

* 관계대수의 일반 집합 연산자

RxS로 표현되며, R과 S에 속한 모든 튜플을 연결해 만들어진 새로운 튜플로 릴레이션 구성

기호는 X로 표시

-> 카티션 프로덕트