그래프 확률 모형
여러 확률변수의 결합분포를 구해야 하는 경우를 생각하자. 예를 들어 A, B, C, 3개의 확률변수가 있고 각 확률변수가 0, 1, 2 세가지의 값만 가질 수 있는 카테고리 확률변수인 경우 이 세 확률변수의 결합분포는 다음과 같이 표로 나타낼 수 있다. 이 표는 33−1=26 개의 모수를 가지므로 (합이 1이 되어야 하므로 하나는 다른 값들에
여러 확률변수의 결합분포를 구해야 하는 경우를 생각하자. 예를 들어 A, B, C, 3개의 확률변수가 있고 각 확률변수가 0, 1, 2 세가지의 값만 가질 수 있는 카테고리 확률변수인 경우 이 세 확률변수의 결합분포는 다음과 같이 표로 나타낼 수 있다. 이 표는 33−1=26 개의 모수를 가지므로 (합이 1이 되어야 하므로 하나는 다른 값들에
그래프(graph)는 다음 그림처럼 노드(node, vertex)와 그 사이를 잇는 간선(edge)으로 이루어진 구조를 말한다. 123456789import networkx as nxfrom IPython.core.display import Imagefrom networkx.drawing.nx_pydot import to_pydotg = nx.complet
다중선형회귀단순선형회귀는 단일 설명변수를 기반으로 반응변수를 예측하는 유용한 기법이다. 하지만 실제로는 보통 하나보다 많은 설명변수가 관련된다. 예를 들어, Advertising 자료에서 판매량과 TV 광고의 상관관계를 조사하였다. 광고자료에는 또한 라디오와 신문광고에
귀무가설을 기각하고 대립가설을 채택했다면, 모델이 데이터에 적합한 정도를 수량화 하고자 할 것이다.선형회귀적합의 질(quality)은 보통 잔차표준오차(RSE)와 R2 통계량을 사용하여 평가한다. Advertising 자료의 TV 광고예산에 대한 판매량의 회귀에서
ubuntu에서 virtualbox로 window를 쓰고 있다.window를 쓰는 와중에 하드디스크 용량이 부족하여 용량을 늘리고 싶어 virtualbox 설정을 이것저것 만져보았지만virtualbox 내의 설정 부분에서는 불가능하다는 것을 알았다. 1VBoxManag
X와 Y의 실제(true) 선형관계는 어떤 알려지지 않은 함수 f에 대해 Y=f(x)+ϵ의 형태를 가지며, ϵ은 평균이 영인 랜덤오차항이다. 만약 f가 선형함수로 근사된다면 이 관계를 다음과 같이 나타낼 수 있다.
3. 선형회귀선형회귀에서 답을 찾아봐야하는 몇 가지 중요한 질문들 광고예산과 판매 사이에 상관관계가 있는가? 광고예산과 판매 사이에 얼마나 강한 상관관계가 있는가? 어느 매체가 판매에 기여하는가? 판매에 대한 각 매체의 효과를 얼마나 정확하게 추정할 수 있는가? 미래의