Na tym przykładzie można zrozumieć jaka jest różnica między określeniem siły związku dwóch zmiennych za pomocą współczynnika determinacji (R2) a określeniem istotności związku między tymi zmiennymi (p-value). Jeśli ma się wystarczająco dużo opisanych ze względu na cechy danych można udowodnić istotność związku nawet zmiennych o dość słabym (ale istotnym) powiązaniu między nimi.

Sam kształt działki nieruchomości zabudowanej jest niewątpliwie wpływem dość subtelnym. Jasno uchwytnym i zrozumiałym co do zasady ale trudnym do udowodnienia na bazie liczb co co samego faktu i wymiaru liczbowego wpływu.

Wpływ kształtu gruntu jest, oczywiście, dość słaby, co nie dziwi. Znacznie silniej wpływają przecież lokalizacja, typ budynku, stan techniczny, nowoczesność, okres budowy, jakość architektury, wielkość zabudowy i powierzchnia gruntu, liczba pięter, podpiwniczenie, różne ograniczenia i utrudnienia planistyczne, strefowe i inne, lokalizacja względem układu drogowego, klasa i stan drogi i dostęp z niej itd. itp. Współczynnik determinacji R2 pokazuje, że kształt działki odpowiada zaledwie za ok. 0,2% całej zmienności cen na rynku.

W żadnym przypadku nie należy jednak utożsamiać faktu niskiego R2 między zmiennymi z brakiem powiązania między nimi. Zależność odwrotna istnieje: zmienne o wysokim R2 są istotnie powiązane ale zależność odwrotna nie zachodzi. Wysoki R2 nie jest warunkiem koniecznym istotności wpływu między zmiennymi a zmienne mogą, jak najbardziej, istotnie powiązane mimo bardzo niskiego R2.

Do stwierdzenia istotności powiązania służy statystyka t-Studenta określająca prawdopodobieństwo (p-value) przypadkowego układu danych, sprawiającego, że przy braku związku przyjmie się jego istnienie. Pozom tego prawdopodobieństwa, tzw. błędu I. rodzaju, nazywa się poziomem istotności.

Obliczone p-value dla związku między wartością nieruchomości zabudowanej niemieszkalnej a wynosi 0,0498, co oznacza, że nawet prosta zależność jest potwierdzona na poziomie istotności 5%.
Siła wpływu kształtu gruntu na nieruchomość wynosi ok. 3,4%/stopień współczynnika kształtu (unormowanego w zakresie od 0 do 10).

Poniżej graf przedstawiający zależność pomiędzy ceną nieruchomości komercyjnych zabudowanych w regionie warszawskim a kształtem działki nieruchomości.

Regresja LN(zł/m2 PC) względem Wk (R2=0,002088). Nieruchomości komercyjne, region warszawski. Wpływ: 3,4%/stopień, p-value:0,0498

realexperts.pl