DBSCAN
K-Means 클러스터링 방법은 단순하고 강력한 방법이지만 클러스터의 모양이 원형이 아닌 경우에는 잘 동작하지 않으며 클러스터의 갯수를 사용자가 지정해주어야 한다는 단점이 있다. DBSCAN(Density-Based Spatial Clustering of Applications with Noise) 방법은 데이터가 밀집한 정도 즉 밀도를 이용하여 클러스터의
다중선형회귀단순선형회귀는 단일 설명변수를 기반으로 반응변수를 예측하는 유용한 기법이다. 하지만 실제로는 보통 하나보다 많은 설명변수가 관련된다. 예를 들어, Advertising 자료에서 판매량과 TV 광고의 상관관계를 조사하였다. 광고자료에는 또한 라디오와 신문광고에
귀무가설을 기각하고 대립가설을 채택했다면, 모델이 데이터에 적합한 정도를 수량화 하고자 할 것이다.선형회귀적합의 질(quality)은 보통 잔차표준오차(RSE)와 R2 통계량을 사용하여 평가한다. Advertising 자료의 TV 광고예산에 대한 판매량의 회귀에서
ubuntu에서 virtualbox로 window를 쓰고 있다.window를 쓰는 와중에 하드디스크 용량이 부족하여 용량을 늘리고 싶어 virtualbox 설정을 이것저것 만져보았지만virtualbox 내의 설정 부분에서는 불가능하다는 것을 알았다. 1VBoxManag
X와 Y의 실제(true) 선형관계는 어떤 알려지지 않은 함수 f에 대해 Y=f(x)+ϵ의 형태를 가지며, ϵ은 평균이 영인 랜덤오차항이다. 만약 f가 선형함수로 근사된다면 이 관계를 다음과 같이 나타낼 수 있다.
3. 선형회귀선형회귀에서 답을 찾아봐야하는 몇 가지 중요한 질문들 광고예산과 판매 사이에 상관관계가 있는가? 광고예산과 판매 사이에 얼마나 강한 상관관계가 있는가? 어느 매체가 판매에 기여하는가? 판매에 대한 각 매체의 효과를 얼마나 정확하게 추정할 수 있는가? 미래의