본문 바로가기

전체 카테고리160

Django 서버 만들고, 랜더링하기 장고를 설치하기 위해서 가상환경을 활성화 후 실행을 하고, pip install django를 하여 설치한다. 초기설정 cmder를 이용할 것이라 cmder을 초기 설정을 해준다. 가상환경 만들기 > mkdir django_pjt # 파일 생성 > cd django_pjt # 가상환경 파일 진입 > dj_venv\Script\activate를 이용하여 가상환경을 활성화한다. 이 후 가상환경 안에서 pip install django 명령어를 이용하여 장고를 설치!!!!!! Django project 생성 django-admin startproject 프로젝트 이름 이라는 명령어로 장고 프로젝트를 생성한다. Django 기본 DB 생성 python manage.py migrate 명령어를 활용하여 DB를 생.. 2022. 11. 28.
결측치 채우는 방법 결측치의 종류 1. MCAR(Missing Completely At Random) : 완전무작위 결측 결측치가 다른 변수들과 아무런 상관이 없는 경우를 말한다. 보통 대부분의 결측치 처리 패키지가 MCAR을 가정하고 있다. 결측치가 존재할 때 결측치가 존재하는 데이터를 삭제하거나 결측치가 속해있는 원본 대규모 데이터셋에서 단순무작위표본추출로 대체한다. 예를 들면, 데이터를 입력하는 사람이 깜빡하고 특정 항목의 데이터를 입력하지 않았다거나 전산 오류로 인한 누락 등이 대표적인 경우에 해당한다. 2. MAR(Missing At Random) : 무작위 결측 누락된 자료가 특정 변수와 연관되어 발생하지만 변수의 결과와는 관계가 없는 경우를 말한다. 결측치가 전체 정보를 갖고 있는 변수에 의해 설명이 가능하다... 2022. 11. 24.
평가 지표 1. Accuracy(정확도) Accuracy는 전체 예측 건수에서 정답을 맞힌 건수의 비율 Accuracy의 특징 가장 직관적으로 모델의 성능을 나타낼 수 있는 평가지표이다. domain의 편중(bias)문제가 발생할 수 있다. 예를 들어, 더운 지역에 눈이오는 날 수를 예측한다고 할 때, 모두 '오지 않는다'라고만 분류기를 만들어도 분류기는 상당히 높은 정확성을 보일 것이다. 이처럼 data자체의 domain이 불균형할 경우 문제가 생길 수 있다. 2. Precision(정밀도) / Recall(재현율) Precision의 특징 Precision(정밀도)은 True라고 분류한 것들 중에서 실제로 True인 것의 비율 PPV(Positive Predictive Value) Positive 정답률이라 불.. 2022. 11. 7.
데이콘 Public 42등 Private 29등! 이번에 데이콘에서 관광데이터 분류하는 대회에 참여했다. 첫 대회라서 신경을 많이 썻던 것 같다. 대회를 하면서 다양한 실험을 할 수 있어서 재밌었다. 데이터를 어떻게 처리하여 모델에 넣을 지, 어떤 모델에서 에폭과 배치 사이즈 Learning Rate 등 여러 실험을 많이 해봤다. 실험을 하다가 이게 왜? 라는 부분이 많았다. 내가 세운 가설이 맞은 줄 알다가도 틀린 경우가 많았다. 아직까지 내가 하는 실험에 대한 공부가 많이 부족한 것 같다. 나중에 취업해서 더 많은 데이터를 분석하고, 좋은 모델을 만들고 싶다! 코드는 우측에 나의 깃허브에 올라와 있다. 2022. 11. 1.
딥러닝 (RNN,LSTM,GRU) 순차적 데이터(sequential data) 순서를 가진 데이터 음성, 동영상, 주식가격 (순서가 중요하다.) 순환신경망(Recurrent Neural Networks) 이전 단계의 처리 결과가 다음 단계에 입력이 되는 형태의 신경망 순서가 있는 데이터를 flatten하면 순서의 의미가 사라지게 된다. 그래서 순환신경망을 사용한다. 순서의 의미도 학습하자 Vanilla RNN Vanilla RNN 문제점 사라지는 경사 (경사소실) 장기 의존 관계를 잘 학습할 수 없음 이전 단계에 입력이 다음 단계에 의미가 없을 수 있다. 동일한 가중치와 tanh로 인해 역전파 시 경사가 소실된다. (ReLu 사용불가 경사가 폭발) LSTM(Long Short Term Memory) 순환신경망의 사라지는 경사 문제를 해결.. 2022. 10. 3.
딥러닝 (손실함수) 손실함수 MSE, RMSE, MAE는 손실함수이다. MSE의 특징 Mean Square Error는 예측값과 정답의 차이를 제곱하기 때문에, 이상치에 대해 민감하다. 정답에 대해 예측값이 매우 다른 경우, 그 차이는 오차값에 상대적으로 크게 반영된다. 오차값에 제곱을 취하기 때문에 오차가 0과 1 사이인 경우에, MSE에서 그 오차는 본래보다 더 작게 반영되고, 오차가 1보다 클 때는 본래보다 더 크게 반영된다. 모든 함수값이 미분 가능하다. MSE는 이차 함수이기 때문에 아래와 같이 첨점을 갖지 않는다. RMSE의 특징 MSE에서 루트를 취하기 때문에, MSE의 단점이 커버된다. RMSE는 그 MSE에서 루트를 취하기 때문에 미분 불가능한 지점을 갖게된다. MSE 보다 이상치에 덜 민감하다. 이 RMS.. 2022. 10. 2.
728x90