728x90
데이터
데이터(data)란?
- 어떤 값을 포함하고 있는 가공되지 않은 1차적인 자료
- 이름, 나이, 날짜, 이미지, 텍스트 등
데이터 종류
- 정형 데이터
- 구조화된 데이터 , 미리 정해진 구조에 따라 저장되는 데이터
- 반정형 데이터
- 구조화 되어 있지만, 반드시 지킬 필요는 없는 데이터
- HTML, XML ,JSON, YAML
- 비정형 데이터
- 정해진 구조가 없이 저장된 데이터
- 텍스트, 이미지, 음성
빅데이터란?
- 정형데이터 뿐만 아니라 반정형, 비정형 데이터가 복합적으로 구성
- 빅데이터의 특성
1) 다양성(Variety)
- 전통적인 데이터와 달리 구조적인 데이터뿐만 아니라 비구조적인 데이터를 포함
- 생성되는 데이터의 80%가 비디오, 이미지, 문서 등과 같은 비정형 데이터
2) 규모(Volume)
- 기존의 DBMS가 관리하던 데이터가 기가바이트수준이었다면 테라바이트나 페타바이트이상을 의미
3) 속도(Velocity)
- 데이터 생성에서 유통되어 소비되는 기간이 대폭 단축되었음을 의미
- 매분 72시간의 유튜브 영상, 216,000개의 인스타그램 포스트가 업로드
3가지 특성에 가치(Value), 변동성(Variability), 정확성(Veracity), 복잡성(Complexity) 등 추가되었고,
최근에는 빅데이터 특성을 3V에서 4V, 6V, 6V+1C로 확장하여 제시한다.
DBMS 이해
- Database 란?
- 구조화된 데이터의 모임
- 여러 사람이 공유하고 사용할 목적으로 만들어진 데이터의 집합
- DBMS 란?
- 데이터베이스를 관리하는 시스템
- 관계형 DBMS를 많이 사용
- Database 종류
- RDB
- 관계형 데이터 베이스
- 정형 데이터를 다루기 위함
- MySQL, Oracle , PostgreSQL 등이 있다.
- NoSQL
- 관계형 데이터 베이스 X
- SQL 이 아니다.
- MongoDB, Hbase 등이 있다.
이것에 대한 부가 설명은 밑에서 참고하면 된다.
Table
- RDB에서 행과 열로 이루어져 있는 데이터베이스의 단위
- 행(Row)
- 테이블의 가로축 데이터
- Tuple, Record 라고도 한다.
- 열(Column)
- 테이블의 세로축 데이터
- Field, Attribute 라고도 한다
SQL(Structured Query Language)
- 데이터베이스에 접근하고 조작하는 언어
- SQL을 통해 필요한 데이터를 생성, 조회, 수정, 삭제 할 수 있다.
- SQL은 사람과 RDB 사이에 데이터 처리를 위해 소통하는 언어
- SQL은 표준이 있다(동일한 구문으로 다른 RDB에서도 사용 가능하다.)
- 표준이 있지만 SQL 구문 과 기능의 차이는 존재
- SQL의 종류
- DDL(Data Definition Language)
- 데이터베이스와 테이블을 정의, 수정, 삭제하는 구문
- CREATE , ALTER , DROP
- DML(Data Manipulation Language)
- 테이블의 데이터를 삽입, 조회, 수정, 삭제 하는 구문
- INSERT , SELECT, UPDATE , DELETE
- DCL(Data Control Language)
- 데이터의 보안, 무결성 , 회복 등을 제어하는 구문
- GRANT, REVOKE, COMMIT, ROLLBACK
데이터 베이스는 학교에서 배우기도 하여서 그런지 이해하기 쉬웠다.
그리고 강사님이 데이터 사이언티스트는 데이터를 조회만 잘하면 되고, 깊게까지는 안들어가도 된다고 말씀해주셨다.
728x90
'AI 공부 > SQL' 카테고리의 다른 글
SQL (Open API와 HTTP) (0) | 2022.08.18 |
---|---|
SQL (having 절과 Join) (0) | 2022.08.16 |
SQL (조회하기 실습 및 One-hot Encoding) (0) | 2022.08.12 |
SQL (DDL,DML,DCL) (0) | 2022.08.11 |
댓글