Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.
Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.
Liczba kombinacji
Jeżeli mamy potencjalnych zmiennych objaśniających, to liczba wszystkich kombinacji jest równa
Indywidualna pojemność nośników informacji
Dla wszystkich otrzymanych kombinacji definiujemy tzw. Indywidualną pojemność nośników informacji, która określona jest wzorem:
gdzie:
- – numer kombinacji
- – liczba zmiennych w -tej kombinacji,
- – numer zmiennej w rozpatrywanej kombinacji,
- – współczynnik korelacji potencjalnej zmiennej objaśniającej o numerze j ze zmienną objaśnianą (element wektora ),
- – współczynnik korelacji między -tą i -tą potencjalną zmienną objaśniającą (element macierzy ).
Wskaźnik mierzy wielkość informacji jaką wnosi zmienna o zmiennej objaśnianej w -tej kombinacji. W związku z tym wzrasta, jeżeli współczynnik korelacji wzrasta, a maleje im bardziej zmienna jest skorelowana z pozostałymi zmiennymi objaśniającymi.
Pojemność integralna kombinacji nośników informacji
Dopiero, gdy policzymy indywidualną pojemność nośników informacji dla wszystkich kombinacji, możemy obliczyć pojemność integralną kombinacji nośników informacji według wzoru:
gdzie:
- – numer kombinacji
- – liczba zmiennych w -tej kombinacji,
- – numer zmiennej w rozpatrywanej kombinacji.
Pojemność integralna kombinacji nośników informacji dla -tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie jest największa. Ze względu na znacząca liczbę kombinacji zmiennych, które należy porównać skonstruowana została metoda wykorzystująca kryterium Hellwiga w postaci zadania programowania binarnego, w którym licznik z kryterium Hellwiga jest funkcją celu, a mianownik jest podstawą do zbudowania warunków ograniczających.
Przykład
Dane są:
- zmienna endogeniczna
- zbiór potencjalnych zmiennych objaśniających
- wektor współczynników korelacji liniowej między zmiennymi egzogenicznymi i zmienną endogeniczną
- macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi,
Liczba możliwych kombinacji zmiennych endogenicznych wynosi
- Kombinacje jednoelementowe:
- Kombinacje dwuelementowe:
- Kombinacje trójelementowe:
Bibliografia
- A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X.
- J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9.
- M. Rocki, Własność koincydencji i zmienne katalityczne w doborze zmiennych objaśniających za pomocą zadania programowania zerojedynkowego, „Przegląd Statystyczny” 1/2, Warszawa 2000, ISBN 83-7225-073-1.