감동, 마음이 움직이는 것

[covariance] 본문

Study

[covariance]

Struggler J. 2020. 6. 19. 23:00

이실직고 하자면 나는 covariance가 뭔지 잘 몰랐다. 

들어는 봤지만 그리고 그게 두 개의 변수의 distribution이 random한지 아니면 같은 방향으로 변하는지 아니면 다른 방향으로 변하는지 (하나가 커질때 다른 하나가 커질거냐 작아질거냐)를 나타낸다고 컨셉만 알고 있었는데 그게 곱의 평균과 평균의 곱과 관련이 있는줄은 몰랐다. 

연구를 하던 중 ensemble average를 해야 하는데 내가 A라는 변수값과 AB라는 변수값의 average를 계산해두었었다. 

그런데 B라는 변수의 평균값을 구해야 하는데 귀찮아서 그냥 <AB>/<A>를 했더랬다. 그게 0.5정도가 나왔다.

그런데 B값의 분포를 알고도 알고 싶어서 결국 다시 코드를 짜고 평균값과 분포를 봤는데 <B>~0.3이 아닌가.

결국 <AB>/<A> != <B>였는데 생각해보니 당연히 저게 같다는 게 보장되는 조건이 한 맞는 조건보다 더 한정적이겠구나 싶었다. 

결국 문제를 생각해보니 <AB>와 <A><B>의 비교인데 내가 얻은 결과에서는 <AB> > <A><B>인 상황인 것이었다.

이게 무슨 의미인지 직관적으로 모르겠어서 찾아봤더니 그게 covariance였다. 

covariance의 정의는 <(A-<A>)(B-<B>)>로 정확히 <AB> - <A><B> 였다! (이때까지 이걸 몰랐다는 게 엄청 부끄러웠음 허허허)

 그래서 A와 B가 아무 상관이 없으면 당연히 A가 클 때 B가 클 이유가 없으므로 covariance는 0이되고 

양의 상관관계가 있으면 양수 음의 상관관계가 있으면 음수였던 것이다! 

즉, 나의 데이터에서 A와 B는 양의 상관관계를 가지는 변수들이었던 것! 

덕분에 covariance에 대한 공부를 했네. 

이걸 아직 몰랐다는 게 역시 부끄럽지만 파보길 잘한듯! 이제라도 알게 되어서 다행이다!

 

https://en.wikipedia.org/wiki/Covariance

 

Covariance - Wikipedia

The sign of the covariance of two random variables X and Y In probability theory and statistics, covariance is a measure of the joint variability of two random variables.[1] If the greater values of one variable mainly correspond with the greater values of

en.wikipedia.org

 

'Study' 카테고리의 다른 글

Michaelis–Menten kinetics  (0) 2021.06.08
[LUCA]  (0) 2020.10.06
[neutral theory] 공부해야 할 것  (0) 2020.06.15
[index theory] nonlinear dynamics  (0) 2019.05.03
마이크로 바이옴 프리퀀시 디펜던트  (0) 2019.02.08