본문 바로가기

AI 공부53

(머신러닝) 성능측정 모델 성능 평가지표(Metric) 실제값과 모델에 의해 예측된 값을 비교하여 모델의 성능을 측정하는 것 모델 평가 목적: Over FItting을 방지하고 최적의 모델을 찾기 위해서 회귀 문제 성능측정 사이킷런에서 제공해주는 데이터셋 당뇨병 진행도를 예측하는 데이터셋 데이터 가져오기 from sklearn.datasets import load_diabetes diabetes = load_diabetes() diabetes.data, diabetes.target 학습셋과 검증셋 분리 SEED = 42 from sklearn.model_selection import train_test_split x_train, x_valid, y_train, y_valid = train_test_split(data,targ.. 2022. 9. 6.
인공지능과 머신러닝의 개념 인공지능(Artificial Intelligence, AI) 머신러닝과 딥러닝을 포괄하는 종합적인 분야 보통의 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구하는 기술 또는 과학 파이토치가 좋다. 연구하는 사람들이 파이토치에 업로드한다. 손으로 쓴 숫자 “8”을 컴퓨터가 인식하게 하려면 어떤 코드(규칙)가 필요할까? "구멍이 2개이고 중간 부분이 홀쭉하며, 맨 위와 아래가 둥근 모양이 라면 8이다…" 많은 규칙이 필요하고, 유지보수가 어려움 이를 대체하기 위한 새로운 방법인 머신러닝이 등장 머신러닝(Machine Learning) 데이터로부터 규칙을 학습하여 정답을 예측 할 수 있도록 하는 알고리즘을 개발하는 연구 분야 예전 전통적인 프로그래밍을 보면 개발자가 데이터의 규칙을 찾아서 정답을 도출해내.. 2022. 9. 5.
파이썬 (seaborn) Seaborn 내부적으로 Matplotlib을 호출하여 시각화하는 라이브러리 Seaborn 모듈을 사용하면 단순히 Matplotlib 하나만 사용할 때 보다 더 편하게 차트를 그릴 수 있다. 즉, Matplolib 시각화 차트 그리기를 Seaborn이 쉽게 그릴 수 있도록 도와준다. 예제를 통해 따라가보자. - 교육용 데이터 가져오기 matplolib과 동일하게 Colab한글 깨짐 방지 코드를 실행해준다. 파이썬 (Matplotlib) colab 한글 깨짐 방지 실행 후 런타임 다시 시작할 것 !apt -qq -y install fonts-nanum > /dev/null import matplotlib.pyplot as plt import matplotlib.font_manager as fm fontpa.. 2022. 8. 31.
파이썬 (Matplotlib) colab 한글 깨짐 방지 실행 후 런타임 다시 시작할 것 !apt -qq -y install fonts-nanum > /dev/null import matplotlib.pyplot as plt import matplotlib.font_manager as fm fontpath = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf' font_name = fm.FontProperties(fname=fontpath).get_name() fm._rebuild() %config InlineBackend.figure_format = 'retina' plt.rc('font', family=font_name) plt.rcParams['axes.unicode_minus'] .. 2022. 8. 31.
파이썬 (Pandas를 이용한 전처리 - 1) 결측치 다루기 - 데이터 파악 null인 경우 = True df.isnull() # 한행에 한열에 해당하는 값을 데이터 포인트라고 함. => passengeridsurvivedpclassnamegenderagesibspparchticketfarecabinembarked 0FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseTrueFalse 1FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalse 2FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseTrueFalse 3FalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalseFalse 4.. 2022. 8. 30.
파이썬 (Pandas를 이용한 EDA) EDA(Exploratory Data Analysis) 탐색적 데이터 분석 데이터를 분석하고 결과를 도출하는 과정에 있어서 지속적으로 해당 데이터에 대한 탐색과 이해를 기본적으로 가져야 한다는 의미 데이터 종류 - 수치형 데이터 연속형 일정범위 안에서 어떤값도 취할수 있는 실수형 데이터(ex. 온도, 키, 풍속 ,운임료) 이산형 횟수 같은 정수형 데이터(ex.사건에 대한 발행 횟수, 방개수, 부모자식수) - 범주형 데이터 가능한 범주안의 값만 취할수 있는 데이터 성별: 남/여(명목형) 전공: 경영학/교육학/인문학(명목형) 장르: 스릴러/공포/드라마(명목형) 영화평점: 1/2/3/4/5(순서형) 직급: 대리/과장/차장/부장(순서형) - Features , 독립변수, 설명변수 학습데이터의 특성 - class.. 2022. 8. 30.
728x90