Na tym przykładzie można zrozumieć jaka jest różnica między określeniem siły związku dwóch zmiennych za pomocą współczynnika determinacji (R2) a określeniem istotności związku między tymi zmiennymi (p-value). Jeśli ma się wystarczająco dużo opisanych ze względu na cechy danych można udowodnić istotność związku nawet zmiennych o dość słabym (ale istotnym) powiązaniu między nimi.
Sam kształt działki nieruchomości zabudowanej jest niewątpliwie wpływem dość subtelnym. Jasno uchwytnym i zrozumiałym co do zasady ale trudnym do udowodnienia na bazie liczb co co samego faktu i wymiaru liczbowego wpływu.
Wpływ kształtu gruntu jest, oczywiście, dość słaby, co nie dziwi. Znacznie silniej wpływają przecież lokalizacja, typ budynku, stan techniczny, nowoczesność, okres budowy, jakość architektury, wielkość zabudowy i powierzchnia gruntu, liczba pięter, podpiwniczenie, różne ograniczenia i utrudnienia planistyczne, strefowe i inne, lokalizacja względem układu drogowego, klasa i stan drogi i dostęp z niej itd. itp. Współczynnik determinacji R2 pokazuje, że kształt działki odpowiada zaledwie za ok. 0,2% całej zmienności cen na rynku.
W żadnym przypadku nie należy jednak utożsamiać faktu niskiego R2 między zmiennymi z brakiem powiązania między nimi. Zależność odwrotna istnieje: zmienne o wysokim R2 są istotnie powiązane ale zależność odwrotna nie zachodzi. Wysoki R2 nie jest warunkiem koniecznym istotności wpływu między zmiennymi a zmienne mogą, jak najbardziej, istotnie powiązane mimo bardzo niskiego R2.
Do stwierdzenia istotności powiązania służy statystyka t-Studenta określająca prawdopodobieństwo (p-value) przypadkowego układu danych, sprawiającego, że przy braku związku przyjmie się jego istnienie. Pozom tego prawdopodobieństwa, tzw. błędu I. rodzaju, nazywa się poziomem istotności.
Obliczone p-value dla związku między wartością nieruchomości zabudowanej niemieszkalnej a wynosi 0,0498, co oznacza, że nawet prosta zależność jest potwierdzona na poziomie istotności 5%.
Siła wpływu kształtu gruntu na nieruchomość wynosi ok. 3,4%/stopień współczynnika kształtu (unormowanego w zakresie od 0 do 10).
Poniżej graf przedstawiający zależność pomiędzy ceną nieruchomości komercyjnych zabudowanych w regionie warszawskim a kształtem działki nieruchomości.