본문 바로가기

데이터 분석/데이콘3

데이콘 public 35등 private 45등! 이번에 데이콘 건설오일 대회를 나갔다. 혼자서 나간 첫 대회인 만큼 엄청 신경쓰고 매일 매일 열심히 했다. 게다가 10등안에 들면 현대중공업에 입사를 할 수 있는 좋은 기회도 있었다. 자세한 코드는 여기서 볼 수 있다. GitHub - DoItSon/Dacon Contribute to DoItSon/Dacon development by creating an account on GitHub. github.com 이번 대회를 하면서 다양한 모델을 공부해볼 수 있어서 좋았다. 많이 성장한 것 같았고, 데이터 사이언티스트가 되면 행복하겠다는 생각도 들었다. 한가지 아쉬운 것이 있다면 private에서 45등이라 코드제출과 재학증명서를 제출하지 않은 것이다. 당연히 안될 줄 알았는데 2차 평가 발표자 리스트를 보.. 2022. 12. 25.
데이콘 Public 42등 Private 29등! 이번에 데이콘에서 관광데이터 분류하는 대회에 참여했다. 첫 대회라서 신경을 많이 썻던 것 같다. 대회를 하면서 다양한 실험을 할 수 있어서 재밌었다. 데이터를 어떻게 처리하여 모델에 넣을 지, 어떤 모델에서 에폭과 배치 사이즈 Learning Rate 등 여러 실험을 많이 해봤다. 실험을 하다가 이게 왜? 라는 부분이 많았다. 내가 세운 가설이 맞은 줄 알다가도 틀린 경우가 많았다. 아직까지 내가 하는 실험에 대한 공부가 많이 부족한 것 같다. 나중에 취업해서 더 많은 데이터를 분석하고, 좋은 모델을 만들고 싶다! 코드는 우측에 나의 깃허브에 올라와 있다. 2022. 11. 1.
쇼핑몰 지점별 매출액 예측 데이터 분석 (따라하기) 데이터 파악하기 현재 다운 받은 데이터는 train.csv, test.csv, sample_submission.csv으로 총 3가지이며, 모두 csv파일이다. 데이터 넣기 로컬에 저장되어 있는 데이터를 코랩에 업로드하였다. 업로드 한 후 데이터를 불러오고 살펴보기 위해 pandas 라이브러리를 사용하였다. 데이터 확인 이 후 데이터 불러와 보고, 확인하였다. 이렇게 데이터가 잘 나오는 것을 확인할 수 있다. 그리고 head( ), tail( ) 메소드를 이용하여 최상단 데이터 5개와 최하단 데이터 5개를 표시하여 칼럼들을 살펴봤다. 칼럼은 총 13개이고, store는 1~45, date는 2010 5월 ~ 2012 9월까지 있는 것이 파악이 된다. 마지막으로 데이터 결측치 및 변수들의 탑입을 확인하기 위.. 2022. 7. 28.
728x90