본문 바로가기

AI 공부53

SQL (having 절과 Join) having 절 - group by 집계 결과에 대한 조건을 거는 것 예시 -- 객실 별로 생존률이 0.7 이상의 객실만 보고싶다면??? select cabin, avg(survived) as survived_rate from titanic_raw group by cabin having survived_rate >= 0.7 order by survived_rate; 위와 같이 having절은 group by 다음에 온다는 특징이 있다. limit - 조회되는 행 갯수를 지정할 수 있다. 예시 select * from titanic_raw limit 2,10; # 행번호, 몇개 -- 행번호 값을 생략 시 select * from titanic_raw limit 5; # 기본 값으로 0이 들어간다. limi.. 2022. 8. 16.
SQL (조회하기 실습 및 One-hot Encoding) 캐글 타이타닉 오늘은 캐글에 있는 타이타닉 데이터를 가지고, 실습을 해보았다. /* passengerid - 승객 id (PK) survied - 생존 여부 (0:사망, 1:생존) pclass - 객실 등급 (1, 2, 3) name - 이름 gender - 성별 (male: 남성, female: 여성) sibsp - 동반한 형제 또는 자매 또는 배우자 수 parch - 동반한 부모 또는 자식의 수 ticket - 티켓번호 fare - 요금 cabin - 객실번호 embarked - 탑승한 항구 (C: 프랑스 항국, Q: 아일랜드 항구, S: 영국 항구) */ 이것은 칼럼들에 대한 설명을 적어놓은 것이다. 이제부터 조회를 해보겠다. -- 컬럼을 선택해서 조회할 수 있다. select name,age fr.. 2022. 8. 12.
SQL (DDL,DML,DCL) DDL - 데이터베이스와 테이블을 정의하는 언어 - CREATE: 데이터베이스와 테이블을 생성하는 명령어 - ALTER: 테이블을 수정하는 명령어 - DROP: 데이터베이스와 테이블을 삭제하는 명령어 - 데이터베이스 및 테이블 생성 (CREATE) Workbench를 설치 후 데이터베이스가 잘 설치되는지 확인하기 위해 다음과 같이 실행해봤다. create database test; -- 데이터베이스 삭제 drop database test; -- 데이터베이스 삭제시 조건 주기 drop database if exists test; 잘 실행이 된다. 마지막에 조건을 주지 않으면 모든 데이터베이스가 삭제될 수 있다. 그래서 삭제하는 명령어를 쓸 때는 조건을 주는 것이 좋다. 이 후 테스트가 아닌 실제로 들어가보.. 2022. 8. 11.
SQL (데이터의 이해와 SQL) 데이터 데이터(data)란? 어떤 값을 포함하고 있는 가공되지 않은 1차적인 자료 이름, 나이, 날짜, 이미지, 텍스트 등 데이터 종류 - 정형 데이터 구조화된 데이터 , 미리 정해진 구조에 따라 저장되는 데이터 - 반정형 데이터 구조화 되어 있지만, 반드시 지킬 필요는 없는 데이터 HTML, XML ,JSON, YAML - 비정형 데이터 정해진 구조가 없이 저장된 데이터 텍스트, 이미지, 음성 빅데이터란? 정형데이터 뿐만 아니라 반정형, 비정형 데이터가 복합적으로 구성 - 빅데이터의 특성 1) 다양성(Variety) 전통적인 데이터와 달리 구조적인 데이터뿐만 아니라 비구조적인 데이터를 포함 생성되는 데이터의 80%가 비디오, 이미지, 문서 등과 같은 비정형 데이터 2) 규모(Volume) 기존의 DBM.. 2022. 8. 11.
파이썬 (pip와 가상 환경) 마지막! PIP란? Package Installer for Python Python 패키지를 설치하고 관리하는 패키지 매니저 Python 3.4 버전 이후에는 설치되어있다. https://pypi.org/ => 다양한 라이브러리 확인가능 - pip list 현재 설치된 패키지 리스트와 버전을 출력 !pip list # 노트북이라 ! 붙임. 리눅스에서는 ! 안붙임 - 패키지 설치하기 pip install ----------------------------------------- !pip install catboost # MS 머신러닝 모델 - 패키지 삭제하기 pip uninstall --------------------------- !pip uninstall catboost - 패키지 기록하기 내 개발 환경을 복구.. 2022. 8. 10.
파이썬 (파일(JSON) 입출력, 구글 드라이브 마운트, YAML, pickle 모듈) 파일 입출력 - open 함수 파일을 열 수 있는 함수 파일 객체를 반환 w: 쓰기 모드 a: 추가 모드 r: 읽기 모드 - 쓰기 모드 (w) 예시 f = open("memo.txt","w") for i in range(1,11): data = f"{i} 번째 줄\n" f.write(data) # 파일 안에 쓰겠다. f.close() 위와 같이 for문을 이용하여 1부터 10까지 반복하여 글이 txt파일로 저장되도록 하였다. 쓰기 모드로 여는 순간 기존 파일에 내용을 덮어띄우기 떄문에 내용이 사라진다는 특징이 있다. - 추가 모드 (a) 예시 f = open("memo.txt","a") data = "11 번째 줄\n" f.write(data) f.close() 추가 모드는 단순히 내용을 추가하는 것으로.. 2022. 8. 10.
728x90