본문 바로가기
AI 공부/SQL

SQL (데이터의 이해와 SQL)

by AI Sonny 2022. 8. 11.
728x90
데이터

데이터(data)란?

  • 어떤 값을 포함하고 있는 가공되지 않은 1차적인 자료
  • 이름, 나이, 날짜, 이미지, 텍스트 등

 

데이터 종류

- 정형 데이터

  • 구조화된 데이터 , 미리 정해진 구조에 따라 저장되는 데이터

 

- 반정형 데이터

  • 구조화 되어 있지만, 반드시 지킬 필요는 없는 데이터
  • HTML, XML ,JSON, YAML

 

- 비정형 데이터

  • 정해진 구조가 없이 저장된 데이터
  • 텍스트, 이미지, 음성

 


빅데이터란?

  • 정형데이터 뿐만 아니라 반정형, 비정형 데이터가 복합적으로 구성

- 빅데이터의 특성 

 

1) 다양성(Variety)

  • 전통적인 데이터와 달리 구조적인 데이터뿐만 아니라 비구조적인 데이터를 포함
  • 생성되는 데이터의 80%가 비디오, 이미지, 문서 등과 같은 비정형 데이터

 

2) 규모(Volume)

  • 기존의 DBMS가 관리하던 데이터가 기가바이트수준이었다면 테라바이트나 페타바이트이상을 의미

 

3) 속도(Velocity)

  • 데이터 생성에서 유통되어 소비되는 기간이 대폭 단축되었음을 의미
  • 매분 72시간의 유튜브 영상, 216,000개의 인스타그램 포스트가 업로드

 

3가지 특성에 가치(Value), 변동성(Variability), 정확성(Veracity), 복잡성(Complexity) 등 추가되었고,

 

최근에는 빅데이터 특성을 3V에서 4V, 6V, 6V+1C로 확장하여 제시한다.

 

 


DBMS 이해

- Database 란?

  • 구조화된 데이터의 모임
  • 여러 사람이 공유하고 사용할 목적으로 만들어진 데이터의 집합

 

- DBMS 란?

  • 데이터베이스를 관리하는 시스템
  • 관계형 DBMS를 많이 사용

 

- Database 종류

 

- RDB

  • 관계형 데이터 베이스
  • 정형 데이터를 다루기 위함
  • MySQL, Oracle , PostgreSQL 등이 있다.

- NoSQL

  • 관계형 데이터 베이스 X
  • SQL 이 아니다.
  • MongoDB, Hbase 등이 있다.

 

이것에 대한 부가 설명은 밑에서 참고하면 된다.

 

 

SQL과 NoSQL의 차이

데이터베이스란? 데이터베이스는 일반적으로 컴퓨터 시스템에 전자적으로 저장되는 구조화된 정보 또는 데이터의 조직화된 모음으로 데이터베이스는 일반적으로 데이터베이스 관리 시스템(DBM

ai-sonny.tistory.com

 

Table

  • RDB에서 행과 열로 이루어져 있는 데이터베이스의 단위

- 행(Row)

  • 테이블의 가로축 데이터
  • Tuple, Record 라고도 한다.

- 열(Column)

  • 테이블의 세로축 데이터
  • Field, Attribute 라고도 한다

 


SQL(Structured Query Language)

  • 데이터베이스에 접근하고 조작하는 언어
  • SQL을 통해 필요한 데이터를 생성, 조회, 수정, 삭제 할 수 있다.
  • SQL은 사람과 RDB 사이에 데이터 처리를 위해 소통하는 언어
  • SQL은 표준이 있다(동일한 구문으로 다른 RDB에서도 사용 가능하다.)
  • 표준이 있지만 SQL 구문 과 기능의 차이는 존재

 

- SQL의 종류

  • DDL(Data Definition Language)
    • 데이터베이스와 테이블을 정의, 수정, 삭제하는 구문
    • CREATE , ALTER , DROP
  • DML(Data Manipulation Language)
    • 테이블의 데이터를 삽입, 조회, 수정, 삭제 하는 구문
    • INSERT , SELECT, UPDATE , DELETE
  • DCL(Data Control Language)
    • 데이터의 보안, 무결성 , 회복 등을 제어하는 구문
    • GRANT, REVOKE, COMMIT, ROLLBACK

 


데이터 베이스는 학교에서 배우기도 하여서 그런지 이해하기 쉬웠다.

 

그리고 강사님이 데이터 사이언티스트는 데이터를 조회만 잘하면 되고, 깊게까지는 안들어가도 된다고 말씀해주셨다.

728x90

'AI 공부 > SQL' 카테고리의 다른 글

SQL (Open API와 HTTP)  (0) 2022.08.18
SQL (having 절과 Join)  (0) 2022.08.16
SQL (조회하기 실습 및 One-hot Encoding)  (0) 2022.08.12
SQL (DDL,DML,DCL)  (0) 2022.08.11

댓글