1. POJĘCIE FUNKCJI REGRESJI
Równanie regresji jest ilościowym wyrazem zależności między określonymi wartościami zmiennej niezależnej i odpowiadającymi im średnimi wartościami zmiennej zależnej.
gdzie:
- nieznana warunkowa średnia wartość zmiennej zależnej
x - określona (znana) wartość zmiennej niezależnej
f - określona postać funkcji
gdzie:
ei - reszty modelu (zaobserwowane wartości składnika losowego określającego odchylenia przypadkowe poszczególnych wartości zmiennej y od wartości funkcji f(x)).
Klasyczna metoda najmniejszych kwadratów ( NMK ) polega na takim oszacowaniu parametrów funkcji regresji, aby dla danych z próby wyrażenie
* = * [yi - f(xi) ]2
osiągnęło minimum.
W przypadku funkcji liniowej: y = ax+b otrzymujemy:
* = * [yi -axi -b)2 min.
Układ równań normalnych:
Wartość współczynnika regresji - a wyraża, o ile przeciętnie (średnio) zmieni się (wzrośnie lub zmniejszy się ) zmienna y, jeśli zmienna niezależna x wzrośnie o jednostkę.
2. MIARY DOKŁADNOŚCI DOPASOWANIA FUNKCJI REGRESJI DO DANYCH EMPIRYCZNYCH
• Odchylenie standardowe składnika resztowego
gdzie:
n - liczebność próby
k - liczba szacowanych parametrów
Wielkość odchylenia standardowego reszt interpretujemy jako przeciętne odchylenie zaobserwowanych wartości zmiennej zależnej yi od jej wartości teoretycznych.
• Empiryczny współczynnik zbieżności i współczynnik determinacji
Punktem wyjścia pomiaru dokładności dopasowania prostej regresji do danych empirycznych jest następujący podział odchylenia obserwowanej wartości yi od średniej :
yi - = ( - ) + (yi - )
*(yi - )2 = *( - )2 + *(yi - )2
Współczynnik zbieżności *2 zawiera się w przedziale <0,1> i informuje jaka część zaobserwowanej w próbie całkowitej zmienności y jest dziełem przypadku ( nie została wyjaśniona regresją liniową względem x ).
Wartość współczynnika determinacji R2 zawiera się w przedziale <0,1> i informuje jaka część zaobserwowanej w próbie całkowitej zmienności y została wyjaśniona regresją liniową względem x .