로딩...

house price prediction

서울시 아파트 가격 예측에 대한

  • 나는 내 학습목표를 달성하기 위해 무엇을 어떻게 했는가?
    • 수업 진도표에 맞추서 강의를 수강
    • 추가학습
      • ensemble 등 강의를 들었지만 이해가 완전히 되지 않는 부분이 많았고 이를 해소하기 위해서 ChatGPT 를 통해 이해를 심화
      • numpy, pandas 등 데이터 전환간 혼동피하기 위해 ChatGPT 를 활용
    • 베이스코드 없이 시작을 하려고하니 아무것도 떠오르지 않음
      • 주어진 베이스코드 코드 한줄 한줄을 이해하려고 함
      • 학습 과정에서 주어진 7단계 과정의 순서를 체화하려고 함
    • 파라메터 튜닝
      • gpu 셋업이 안되어 있어서 이를 설정
      • optuna 를 통한 파라메터 튜닝을 시도
      • 파라메터 튜닝하는 동안 이를 기록하기 위해 파일에 기록
  • 마주한 한계는 무엇이며, 아쉬웠던 점은 무엇인가?
    • 이해 부족
      • 여러가지 모델중 어떤 모델을 선택해야하는 지에 대한 지식의 부재
      • 폴드나, 평가 지표에 대한 이해 부족
      • 데이터 처리 사이클을 정해진 것인데 이 때문에 체계적으로 일을 진행하지 못하면서 비효율적으로 시간을 소모
    • 익숙하지 않음
      • 툴/라이브러리 에 익숙해지는데 시간이 소요됨
    • 예측해야하는 타겟에 대한 정확한 이해
      • 기간이 정해져있었음
    • 협업이 원할지 않았던 팀이라 시너지가 없었던 것이 아쉬웠으나 개인 공부하기도 바빴던 수준이었다.
    • 대회와 베이스라인 코드에 대한 설명 강의가 있는 것을 대회가 끝나고 알았음
  • 한계/교훈을 바탕으로 다음 경진대회에서 시도해보고 싶은 점은 무엇인가?
    • 컴퓨팅 자원 효율 최대화
      • EDA 부터 제출까지의 사이클을 먼저 돌려서 추가적인 EDA를 하는 중에도 자원을 쉬지 않게 하는 목표
      • 데이터 처리 사이클은 정해진 것이므로 이를 순서대로 진행해서 빠른 사이클 완성
    • 쥬피터의 효과적인 활용
      • 길어지면 재사용성이 덜어지는 것으로 생각됨
      • 단계를 파일 단위 output 을 생산하고 다음 파일로 진행