EveryDay.DevUp

패스트캠퍼스 환급챌린지 42일차 : Part4. 인공지능의 이해 Lv3 : 인공지능을 바탕으로한 실습 본문

패스트캠퍼스/딥러닝·인공지능Signature초격차패키지Online

패스트캠퍼스 환급챌린지 42일차 : Part4. 인공지능의 이해 Lv3 : 인공지능을 바탕으로한 실습

EveryDay.DevUp 2025. 4. 15. 20:40

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/4hTSJNB

 

커리어 성장을 위한 최고의 실무교육 아카데미 | 패스트캠퍼스

성인 교육 서비스 기업, 패스트캠퍼스는 개인과 조직의 실질적인 '업(業)'의 성장을 돕고자 모든 종류의 교육 콘텐츠 서비스를 제공하는 대한민국 No. 1 교육 서비스 회사입니다.

fastcampus.co.kr

Ch02-02 제조 데이터의 분류기 실습 - 주요 코드 미리보기
1) 데이터 분할
- X 값에는 피처에 해당하는 독립 변수 설정
- Y 값에는 타겟에 해당하는 종속 변수 설정
2) 학습데이터와 테스트 데이터의 분리
- train_test_split
: 데이터의 분헐 비율 설정
: 랜덤데이터 분할 설정
: 스트레이티파이 -> 데이터의 균등 분할을 위해 사용
3) 의사결정트리분류모델 생성
- 앙상블을 사용하기 위해 트리 모델 추가
: 랜덤포레스트 분류기
: 그라디언트부스팅 분류기
: XGB 분류기
: LGBMC 분류기
4) 모델 학습
5) 모델평가

Ch02-03 제조데이터의 분류기 실습 - 실습
- 모델에 따라서 데이터의 전처리가 필요할 수 있음
: 스탠다드 스케일러 사용

Ch03-01 자전거 대여량 예측 모델 실습 - 문제 정의 및 데이터의 이해
- Regressor 학습 및 성능개선 방법, 주요 성능 지표의 비교
- X,Y에 데이터를 로드/학습 데이터와 테스트 데이터의 분리/선형 회귀 모델 사용/mean squard log로 모델 평가

Ch03-02 자전거 대여량 예측모델 실습 - 구현을 위한 코드의 실행
1) 데이터 관점
- 주어진 데이터에서 의미 있는 피처를 생성
- 불필요한 피처 삭제
- 데이터 형태 변환
: 스케일링과 인코딩 사용
-> 선형회귀모델의 데이터는 정규 분포를 사용 -> 로그 스케일 적용
- 범주형 데이터의 경우 단순 값의 비교를 위해 카테고리화 시킴
- 스탠다드 스케일러를 사용
2) 모델의 관점
- 여러가지 모델을 사용하여 성능평가를 비교
- 하이퍼 파라미터를 변경하면서 좋은 모델을 찾음
- 회귀모델
: Linear Regressor
: RandomForesr Regressor
: XGB Regressor
: LGBM Regressor

=> 태스크에따라서 데이터의 따라서 모델을 선택하고 성능평가를 계속 진행하면서 좋은 모델을 찾는 과정이 필요. 그 과정에서 데이터의 피처와  하이퍼파라미터를 조정하는 것은 사람의 통찰이 필요함.