본문 바로가기

AI 공부/파이썬27

파이썬 (seaborn) Seaborn 내부적으로 Matplotlib을 호출하여 시각화하는 라이브러리 Seaborn 모듈을 사용하면 단순히 Matplotlib 하나만 사용할 때 보다 더 편하게 차트를 그릴 수 있다. 즉, Matplolib 시각화 차트 그리기를 Seaborn이 쉽게 그릴 수 있도록 도와준다. 예제를 통해 따라가보자. - 교육용 데이터 가져오기 matplolib과 동일하게 Colab한글 깨짐 방지 코드를 실행해준다. 파이썬 (Matplotlib) colab 한글 깨짐 방지 실행 후 런타임 다시 시작할 것 !apt -qq -y install fonts-nanum > /dev/null import matplotlib.pyplot as plt import matplotlib.font_manager as fm fontpa.. 2022. 8. 31.
파이썬 (Matplotlib) colab 한글 깨짐 방지 실행 후 런타임 다시 시작할 것 !apt -qq -y install fonts-nanum > /dev/null import matplotlib.pyplot as plt import matplotlib.font_manager as fm fontpath = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf' font_name = fm.FontProperties(fname=fontpath).get_name() fm._rebuild() %config InlineBackend.figure_format = 'retina' plt.rc('font', family=font_name) plt.rcParams['axes.unicode_minus'] .. 2022. 8. 31.
파이썬 (Pandas를 이용한 전처리 - 1) 결측치 다루기 - 데이터 파악 null인 경우 = True df.isnull() # 한행에 한열에 해당하는 값을 데이터 포인트라고 함. => passengeridsurvivedpclassnamegenderagesibspparchticketfarecabinembarked 0FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseTrueFalse 1FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalse 2FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseTrueFalse 3FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalse 4.. 2022. 8. 30.
파이썬 (Pandas를 이용한 EDA) EDA(Exploratory Data Analysis) 탐색적 데이터 분석 데이터를 분석하고 결과를 도출하는 과정에 있어서 지속적으로 해당 데이터에 대한 탐색과 이해를 기본적으로 가져야 한다는 의미 데이터 종류 - 수치형 데이터 연속형 일정범위 안에서 어떤값도 취할수 있는 실수형 데이터(ex. 온도, 키, 풍속 ,운임료) 이산형 횟수 같은 정수형 데이터(ex.사건에 대한 발행 횟수, 방개수, 부모자식수) - 범주형 데이터 가능한 범주안의 값만 취할수 있는 데이터 성별: 남/여(명목형) 전공: 경영학/교육학/인문학(명목형) 장르: 스릴러/공포/드라마(명목형) 영화평점: 1/2/3/4/5(순서형) 직급: 대리/과장/차장/부장(순서형) - Features , 독립변수, 설명변수 학습데이터의 특성 - class.. 2022. 8. 30.
파이썬 (Pandas 기초) Pandas 란? 파이썬에서 데이터를 쉽게 다룰수 있는 라이브러리 2차원형태의 데이터에 대해 집계,전처리 등을 아주 쉽게 할수 있다. 정형데이터를 다루는 라이브러리 Pandas 의 데이터구조 - Dataframe 2차원구조로 되어있는 행렬 데이터 - Series 1차원 구조로 되어있는 한종류의 열방향 데이터 Series 여러개 모이면 Dataframe 된다. import numpy as np import pandas as pd 파이썬 pandas를 numpy와 함께 자주 쓰인다. - Dataframe 만들기 행렬 구조의 리스트를 Dataframe 으로 변환하기 data = [ ["A군",30,170], ["B군",25,180] ] df = pd.DataFrame(data,columns = ["이름","나.. 2022. 8. 30.
파이썬 (Numpy) Numpy 수치계산을 하기 위한 파이썬 라이브러리 딥러닝에서 사용되는 텐서와 매우 유사 백테와 행렬 단위의 대용량 수치 연산을 빠르게 진행 병렬 연산한다. 백터(vector) 1차원 데이터(1차원 배열) 스칼라가 연속적으로 여러개 모여있는 것 스칼라(scalar): 단순하게 측정한 하나의 값 행렬(Matrix) 2차원 데이터(2차원 배열) 1차원 데이터가 여러개 모여 있는 것 벡터 import numpy as np lst = [1,2,3,4,5,6] arr = np.array(lst) arr => array([1, 2, 3, 4, 5, 6]) 행렬 lst = [ [1,2,3], [4,5,6] ] arr = np.array(lst) arr => array([[1, 2, 3], [4, 5, 6]]) 3차원 .. 2022. 8. 24.
728x90