미식가의 개발 일기

[KT 에이블스쿨(6기, AI)] 5주차, 2차 미니 프로젝트 본문

KT 에이블스쿨(6기, AI)

[KT 에이블스쿨(6기, AI)] 5주차, 2차 미니 프로젝트

대체불가 핫걸 2024. 10. 10. 13:34

미션

새롭게 건설할 공공 임대 아파트 단지의 등록 차량 수 예측하기

 

데이터셋
  • features: 총 세대수, 전용면적, 전용면적 별세 대수, 임대료, 준공 일자 
  • target: 실 차량수

 

과제 수행
  1. 데이터 전처리
    • 결측치 처리
    • 가변수화
    • 스케일링
    • 데이터 분리(학습 데이터, 검증 데이터)
    • 데이터 집계, 병합 
  2. 탐색적 데이터분석
    • 단변량 분석: 히스토그램, KDE plot 등
    • 이변량 분석: 상관분석, 산점도, heatmap 등
  3. 모델링
    • 다양한 알고리즘의 성능을 테스트 한 후 최종 알고리즘 선택
    • 데이터 예측
    • 파이프라인 구축 후 test셋으로 테스트 수행

 

느낀점

두 번째 미니 프로젝트!! 이번에도 역시 이틀간 진행 되었습니다. 

첫 번째와 다르게 다시 한 번 랜덤으로 팀원이 배정 되었는데요. 저희 반은 총 16명에 8명씩 1팀으로 배정이 되어서 첫 번째 미니 프로젝트와 겹치는 사람도 몇 명 있었습니다. 

 

이번 프로젝트는 지금까지 배운 내용을 모두 정리하는 프로젝트라는 느낌을 받았습니다!

1주차에 배웠던 Numpy, Pandas를 활용해 데이터 전처리를 하고 2주차에 배웠던 데이터 프레임 조작과 단변량, 이변량 분석을 활용해 데이터의 분포나 관계를 시각화를 통해 확인하고, 원하는 형태로 집계하거나 병합할 수 있었습니다. 마지막으로 4~5주차에 걸쳐 배운 머신러닝을 활용하여 여러가지 알고리즘들의 성능을 테스트 한 후 가장 좋은 모델로 예측을 수행하는 것까지 진행했습니다! 이 과정을 통해 지금까지 배운 내용을 쭉 정리할 수 있었고 조금 헷갈렸던 부분을 한 번 짚고 넘어갈 수 있는 좋은 기회가 된 거 같습니다. 😊 

 

확실히 두 번째라 그런지 시간 분배나 의견을 공유하는데 있어서 훨씬 원활하게 진행된 거 같습니다!

첫 번째 프로젝트 때는 마지막에 시간이 부족해서 아슬아슬하게 끝났었는데 이번에는 비교적 원활하게 팀이 굴러갔던 거 같아요😎 팀원과 함께 의견을 빠르게 취합하고 점검하는데 시간을 많이 들이자는 전략을 세웠고, 덕분에 여유롭게 마무리하고 발표 연습도 할 수 있었어요! 저는 이번에도 ppt 제작을 맡았는데 이번에는 템플릿도 미리 예쁜걸로 찾아놓고 페이지 구상을 먼저 생각하고 참여했던게 도움이 됐던 거 같습니다.

 

 

 

 

 

 

 

 

반응형