EveryDay.DevUp

패스트캠퍼스 환급챌린지 18일차 : 부록 : 나동빈강사님의 부가자료 본문

패스트캠퍼스/딥러닝·인공지능Signature초격차패키지Online

패스트캠퍼스 환급챌린지 18일차 : 부록 : 나동빈강사님의 부가자료

EveryDay.DevUp 2025. 3. 22. 12:58

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/4hTSJNB

 

커리어 성장을 위한 최고의 실무교육 아카데미 | 패스트캠퍼스

성인 교육 서비스 기업, 패스트캠퍼스는 개인과 조직의 실질적인 '업(業)'의 성장을 돕고자 모든 종류의 교육 콘텐츠 서비스를 제공하는 대한민국 No. 1 교육 서비스 회사입니다.

fastcampus.co.kr

Ch01-01 다양한 분포에서 추출해보기 (샘플링)

1) numpy 균등 분포

- 구간 내 모든 데이터에 대하여 추출 확률이 동일

2) Pyplot histogram

- 추출한 데이터를 히스토그램을 그려 확률 분포를 시각화

3) numpy 이항 분포

- yes or no 가 반복되는 확률

4) 정규 분포

- 확률 밀도 함수

5) numpy 포아송

- 일정한 시간 내에 발생하는 사건의 발생 횟수에 대한 확률 계산

6) numpy 지수 분포

- 특정 시점에서 어떤 사건이 일어날 때까지 걸리는 시간의 확률 계산

Ch01-02 실제 데이터 세트의 통계적 특성 분석하기

- 딥러닝에서는 모델의 입력으로 데이터를 넣을 때 사전에 전처리하는 과정을 거치게 되는데, 입력 정규화를 사용하여 딥러닝 모델을 학습시키기 위해 평균과 표준 편차를 사용함

- 이미지 정규화

: R,G,B에 대하여 평균이 0, 표준 편차가 1인 값으로 맞춤으로써, 학습 속도를 개선 시키고 정규화시킴

Ch01-03 추세선 그리기

- 특정한 데이터가 주어졌을 때 추세선을 그려보고, 특성을 분석 => 다항함수로 표현될 수 있지만 일반적으로 1차함수로 사용됨

: 사이킷 런의 선형회귀 라이브러리를 이용해 1차 함수 형태의 추세선을 그릴 수 있음

Ch01-04 다양한 통계 문제, Ch01-05 자료 구조 기체 문제 풀이,Ch02-01 자료구조를 이용해 대량의 데이터 다루기는 실습 및 문제풀이

Ch03-01 대량의 데이터를 파일 입출력하기 

- numpu 나 pandas를 사용하여 대량의 데이터를 파입 입출력으로 다룰 수 있음

: pandas의 데이터 프레임 구조를 활용함

Ch03-02 누락된 데이터 처리하기

- 누락된 데이터의 값을 0 또는 평균 값을 대입하여 처리

Ch03-03 클래스 활용하기

- 클래스는 틀, 인스터는 틀에서 생성학 객체

Ch04-1 나만의 데이터 로더 만들기

- 현실 세계의 데이터 세트는 그 형식이 다양하기 때문에 데이터 로드를 새로 정의해야함

- pytorch에서는 데이터 세트, 데이터 로더를 통해 데이터를 불러오는데 torch.utils.data.dataset을 상속받은 클래스를 통해 데이터 세트를 새로 정의할 수 있음

- elemTree 라이브러리를 사용해서 xml을 읽을 수 있음

Ch04-02 다양한 사전 학습 모델 사용하기

- 전이 학습을 이용할 때 모델의 입력 차원이 정의된 경우가 많음

- 주어진 모델이 있을 때 오류 없이 실행하기 위한 방법으로 네트워크의 마지막에 FC레이어를 적용하여 클래스 개수를 일치 시킴

Ch04-03 Optimze에 따른 모델의 정확도 평가

- 딥러닝은 다양한 최적화 방법을 제공하는 라이브러리를 제공

Ch04-04 WandB를 이용한 학습 및 평가, 로깅

- WandB는 기계학습/딥러닝 개발자를 위한 보조도구로, 학습 과정에 대한 로깅을 제공하여 손실 값이 감소하는 형태를 확인할 수 있음

Ch04-05 적절한 도구 선택하기

- 파이토치, 텐서플로우, 케라스 : 딥러닝 프레임워크

- 텐서 보드, WandB : 로깅 및 디버그

- 아카이브, PaperWithCode : 논문 검색