EveryDay.DevUp

패스트캠퍼스 환급챌린지 7일차 : Part1 딥러닝을 시작하기전에 강의 후기 본문

패스트캠퍼스/딥러닝·인공지능Signature초격차패키지Online

패스트캠퍼스 환급챌린지 7일차 : Part1 딥러닝을 시작하기전에 강의 후기

EveryDay.DevUp 2025. 3. 11. 21:34

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/4hTSJNB

 

온라인 강의 7주년 기념 1+1 이벤트 특별 연장! (3/10~3/12) | 패스트캠퍼스

단 3일! 미션, 리뷰, 인증 NO! 강의 사면 무.조.건 1+1 쿠폰 증정🎉

fastcampus.co.kr

Ch01-11 분산과 표준편차

1) 분산

- 평균과 관측치에 대하여 (관측치 - 평균)의 제곱을 더한 값에 데이터의 개수로 나눈 값

- 1/nΣi=1,n | Xi - u | ^ 2의 수식으로 표현할 수 있음

- 각 데이터가 평균에 가까울 수록 분산이 작아지고 평균에서 멀어질 수록 분산이 커지는 경향을 가지게 됨. 그렇기 때문에 분산을 구하면 데이터가 평균 값과 얼마나 떨어져 있는지 가늠할 수 있음

- 분산은 제곱으로 계산되기 때문에 값이 커지는 경향이 있어, 이를 원래의 값 기준으로 가져오기 위해서는 표준 편차를 계산해야함

: 분산을 구하는 수식에 루트로 계산하면 표준 편차를 계산할 수 있음 

Ch01-12 공분산과 상관계수

1) 공분산

- 확률 변수가 다수 있을 때의 분산을 계산한 것으로 1/n Σi=1,n(Xi - Ux)(Yi - Uy)의 수식을 가짐

- 공분산의 경우 데이터의 위치에 따라 부호가 달라지는데, 공분산의 크기는 원점에서 얼마나 떨어져 있는지를 나타내게 되고, 음수/양수에 따라 방향성을 읽을 수 있음

2) 상관계수

- 일반적으로 공분산에서 크기보다는 방향성(상관성)을 보게 되는데, 공분산에 정규화를 통해 상관계수를 얻을 수 있음

- Sx^2  : x의 분산, Sy^2 : y의 분산, Sxy : x,y의 공분산이라고 한다면 상관계수 = Sxy/√Sx^2*Sy^2 으로 계산할 수 있고 값은 -1~1의 범위를 가지게 됨

- 상관계수의 값이 1에 가까우면 완벽한 양의 상관 관계, -1에 가까우면 강한 음의 상관 관계,  1이면 완벽한 양의 상관 관계 0이면 관련이 없다고 볼 수 있음

3) 공분산 행렬

- 기계 학습 분야에서는 다변수 확률 변수를 벡터로 표현한다고 했을 때, n개의 확률 변수에 대하여 서로의 상관관계를 계산하면 공분산 행렬을 만들 수 있음

[Ax1^2, Ax1,x2, Ax1,x3]

[ Ax1,x2, Ax2^2, Ax2,x3]

[Ax1,x3, Ax2,x3, Ax3^2] 

3개의 다변수 확률 변수가 있다고 할경우, 대각선은 분산이 되고, 비대각선은 공분산이됨 

3) 공분산과 독립

- 두 사건이 동시에 발생활 확률은 각각 발생할 확류을 곱하는 것과 같다는 독립 사건에서 공분산은 0이라는 결과가 나오게 됨

: 역은 성립되지 않기 때문에 공분산이 0이라고 해서 두 사건이 독립이라고 정의할 수 없음