Słowa „statystyka”, „statystyk”, „statystyczny” w ich obecnym znaczeniu liczą zaledwie 100 lat. Termin statystyka pochodzi od łacińskiego słowa „status” – co oznacza państwo.
Zbieranie i zestawianie danych określano ogólnie nazwą statystyka. Dziś także używamy tego terminu w sensie zestawień liczbowych, czy też w sensie zbierania i porządkowania pewnych danych.
Z czasem statystyka obejmuje coraz to inne dziedziny życia –oprócz ekonomicznych i społecznych, w naukach eksperymentalnych, jak np. antropologii, biologii, medycynie, fizyce, chemii, astronomii, rolnictwie i innych.
Zatem nie wystarcza już samo zestawienie i porządkowanie danych, nasuwa się konieczność wyrażania właściwości całego materiału liczbowego, za pomocą jednej lub kilku specjalnych liczb, które by ten materiał najlepiej charakteryzowały. Liczby te nazywamy charakterystykami lub statystykami. Godzi się w tym miejscu zwrócić uwagę, że ostatnio słowo „statystyka” jest używane dla oznaczenia szczególnego rodzaju estymatora (szacunku) obliczonego z obserwowanych danych.
Mamy tu do czynienia ze statystyką w sensie pewnych metod statystycznych.
Tablice statystyczne.
Wyniki obserwacji statystycznej przedstawiamy zazwyczaj w postaci tablic. Tablice statystyczne dają liczbowy obraz struktury badanej zbiorowości. Charakteryzują one badane zjawiska, np. społeczno – gospodarcze, za pomocą liczb podanych w pewnej kolejności i wzajemnie ze sobą powiązanych. Tablice statystyczne stanowią podstawową treść roczników statystycznych i innych publikacji GUS.
Tablica statystyczna jest zatem formą systematycznego uporządkowania danych liczbowych w sposób umowny. Dzięki swojej zawartości ułatwia poznanie badanego zagadnienia i umożliwia porównanie zawartych w niej liczb. Dzięki tablicom statystycznym możemy wykryć i poznać prawidłowości występujące w badanych zjawiskach.
Ze względu na chronologię badań, tablice dzielimy na:
• robocze (surowe) – w nich gromadzimy surowy materiał statystyczny, dane liczbowe, które podlegać będą dalszej „obróbce” (porządkowanie i grupowanie);
• wynikowe (analityczne) – będące ostatecznym produktem tabelarycznego opisu badanego zjawiska, mogą być publikowane i stanowić podstawę wszelkich analiz statystycznych.
Bardzo ważną rolę odgrywa zewnętrzna forma tablicy, jej szata graficzna. Tablica statystyczna powinna być przejrzysta i czytelna. Zasadniczo każda tablica składa się z 3 części:
1. nagłówka (tytułu tablicy) – powinien w kilku słowach w sposób zwięzły, lecz wyczerpujący wyrażać treść tablicy. Powinien zawierać określenie:
• badanej zbiorowości pod względem rzeczowym, przestrzennym i czasowym;
• cechy, według której dokonaliśmy grupowania, np. Ludność Polski w 1977 r. według zawodów – w tym przypadku badana zbiorowość jest określana pod względem rzeczowym (ludność), terytorialnym (Polska), czasowym (1977 r.), określana jest także cecha – zawód.
2. tablicy właściwej – charakteryzuje ona zjawisko społeczno – gospodarcze za pomocą liczb podanych w określonej kolejności i wzajemnie ze sobą powiązanych. Właściwa tablica składa się z krzyżujących się kolumn i wierszy.
3. informacji na temat źródła powstania tablicy – źródła, skąd zaczerpnięte zostały jej dane.
Prezentacja graficzna danych liczbowych.
Ważną rolę w opisowej analizie statystycznej odgrywa prezentacja graficzna danych liczbowych. Przedstawiane w tablicach dane liczbowe mogą być wielocyfrowe i nie w pełni czytelne. Pomocną funkcję analityczną spełniają wykresy, które przedstawiają dane statystyczne za pomocą umownych znaków.
Wykresem nazywać będziemy specjalny, graficzny sposób przedstawiania zjawisk ujętych w szereg statystyczny.
Wykresy nie tylko ułatwiają wstępną diagnostykę zjawiska, lecz również umożliwiają prawidłowy wybór odpowiednich miar opisu strukturalnego. Wykonanie możliwie przejrzystych i czytelnych wykresów wymaga spełnienia kilku warunków dotyczących m.in. doboru odpowiednich skal, jednostek miary itd. Wykresy statystyczne są pochodnymi tablic, na których podstawie są sporządzane.
Aby wykresy należycie spełniały swe zadania, przy ich sporządzeniu uwzględnione być muszą pewne wymogi formalne i estetyczne.
Przede wszystkim wykresy:
• muszą być przejrzyste, estetyczne, starannie i dokładnie wykonane – muszą przyciągać uwagę;
• nie mogą być przeładowane i nie mogą zawierać skomplikowanego opisu, a przy tym powinny:
pozwalać na szeroką interpretację;
dawać prosty i jednoznaczny wyraz temu, co chcielibyśmy przedstawić czytelnikowi.
Wykres statystyczny składa się zasadniczo z tych samych części co tablica statystyczna, a więc:
1. części tekstowej (nad wykresem i pod wykresem);
2. pola wykresu.
Każdy wykres musi być zaopatrzony w tytuł. Tytuł wykresu powinien na pierwszy rzut oka zorientować czytelnika w tematyce wykresu, informować w sposób zwięzły o przedmiocie, miejscu, czasie przedstawionego graficznie zjawiska, musi być przy tym atrakcyjny, jasny i krótki.
W podtytule umieszcza się informacje o istotnych szczegółach uzupełniających treść podaną w tytule, pod wykresem zaś wyjaśnienie zwane legendą (np. rodzaje krzywych, sposób zakreskowania powierzchni). Tekst legendy powinien być krótki i zrozumiały.
Pod wykresem podajemy zawsze źródło, z którego czerpano dane do wykresu.
Przystępując do konstruowania obrazu graficznego statystyk wybiera rodzaj wykresu (zależnie od przedmiotu, który chce zilustrować) oraz związane z nim elementy konstrukcyjne, a przede wszystkim jego skalę.
Skalą nazywamy linię, której poszczególne punkty mogą być odczytywane jako określone liczby. Używamy jej do określenia liczby odpowiadającej danemu odcinkowi lub położeniu punktu.
W statystyce rozróżnia się skale:
• prostoliniowe;
• krzywoliniowe – głównie biegunowe (tych używa się rzadziej);
• punktowe;
• punktowo – obrazkowe (w wykresach popularyzacyjnych).
Do najczęściej używanych w opisanych analizach strukturalnych zalicza się następujące wykresy:
• kołowe, należące do grupy wykresów powierzchniowych;
• histogramy, inaczej określane jako wykresy słupkowe;
• krzywe liczebności (w tym krzywe kumulacyjne), używane wraz z histogramami do analizy danych prezentowanych w postaci szeregów rozdzielczych;
• piramidy, stosowane w analizach demograficznych, np. do ilustracji struktury ludności według wieku i płci;
• kartogramy, stosowane dla analiz strukturalnych w ujęciu przestrzennym;
• wielowymiarowe, użyteczne dla graficznej prezentacji;
• diagramy (wielobok liczebności);
Metoda liniowa.
Najprostszym sposobem graficznego przedstawienia wielkości statystycznej jest metoda liniowa, polegająca na narysowaniu odcinków linii prostych, których długość odpowiada (w odpowiedniej skali) liczebności porównywanych zbiorowości. Linie te mogą być narysowane w płaszczyźnie rysunku poziomo (rys. 1) lub pionowo.
Przykład 1:
Abonenci telewizyjni (Stan w dniu 31. XII)
1965 ________ 2078
1970 ______________ 4215
1975 ________________________ 6472
1980 _____________________________ 7954
1985 _____________________________________ 9468
1990 __________________________________________ 9919
1995 _______________________________________ 9677
|____|____|____|____|____|____|____|____|____|____|____|
(mln) 0 1 2 3 4 5 6 7 8 9 10 11
Źródło: Rocznik statystyczny 1996, s. LXII – LXIII
Rys. 1. Metoda liniowa prezentacji danych statystycznych (wykres liniowy).
Liczby podane z prawej strony linii określają liczbę abonentów telewizyjnych w tysiącach. Podawanie tych liczb nie jest konieczne, ale często stosowane w celu dokładniejszego poinformowania czytelnika, np. jeżeli wykres jest jedynym źródłem informacji.
Diagram (wielobok liczebności).
Diagram jest łamaną powstałą przez połączenie punktów, których współrzędnymi są środki przedziałów klasowych i odpowiadające im liczebności (częstości lub gęstości).
Krzywa liczebności.
Krzywą liczebności tworzymy w taki sam sposób, jak wielobok liczebności, z tym wyjątkiem, że zamiast łamaną, punkty na wykresie łączymy łagodnie przebiegającą krzywą.
Metoda powierzchniowa.
Metoda powierzchniowa polega na przedstawieniu wielkości zjawisk za pomocą pól powierzchni figur geometrycznych. Pola powierzchni tych figur są proporcjonalne do wielkości przedstawionych zjawisk. Do najczęściej stosowanych figur należą wydłużone prostokąty (czyli tzw. słupki), ze względu na łatwość wykonania i dobre ilustrowanie wielkości statystycznych.
Oprócz prostokątów, do ilustrowania różnych liczebności nadają się również dobrze koła o polach powierzchni proporcjonalnych do liczebności.
Wykresy kołowe.
Strukturę zbiorowości przedstawionej w postaci koła wyrażamy wycinkami koła. Oko bardzo dobrze chwyta różnicę kątów w różnych kołach, o ile kąty te nie są zbyt małe i to niezależnie od tego, czy porównywane koła są jednakowej czy różnej wielkości.
Stąd wniosek: o ile głównym celem jest zwrócenie uwagi na różnice struktury, a celem ubocznym – na różnice wielkości zbiorowości, metoda wycinków koła nadaje się doskonale. Rysujemy koła których powierzchnie są proporcjonalne do ogólnej liczebności porównywanych zbiorowości, a podział na wycinki odpowiada strukturze każdej z tych zbiorowości. Pożądane jest ustalenie jednolitego dla wszystkich wykresów kołowych punktu wyjścia, od którego należy rozpocząć odczytywanie wykresu, oraz kierunku, w którym wykres ma być odczytywany.
Wykresy oparte na prostokątach.
Opisują zwykle częstość występowania określonych wielkości cechy zmiennej x lub określonych zjawisk. W pierwszym przypadku podstawa prostokąta określa wartości zmiennej, a jego wysokość określa liczebność lub częstość występowania tychże wartości, w drugim natomiast brana jest pod uwagę wyłącznie wysokość lub długość prostokąta.
Histogramy.
Histogram to wykres, w którym prostokąty przylegają do siebie, ich podstawy są określone rozpiętością przedziałów, a wysokości – liczebnością przedziałów. Tak więc powierzchnia poszczególnych prostokątów pozostaje w tym samym stosunku do ogólnej powierzchni histogramu, co liczebności poszczególnych przedziałów klasowych do ogólnej liczebności szeregu rozdzielczego. Budując histogram na podstawie szeregu rozdzielczego o nierównych przedziałach klasowych należy najpierw sprowadzić liczebności przedziałów do porównywalności, tzn. obliczyć liczebności przypadające w danym przedziale na jednostkę jego rozpiętości.
Wykresy pasmowe.
Wykresy pasmowe charakteryzują badane zjawisko za pomocą pasów o określonej szerokości. Przy ich stosowaniu wielkość zjawiska określona jest wyłącznie za pomocą szerokości pasa, a nie powierzchni. Mogą one opisywać zjawiska demograficzne; rozmiary przepływów siły roboczej, środków pieniężnych, produkcji itp. z danej jednostki gospodarczej, administracyjnej lub organizacyjnej do innych, oraz salda bilansowe.
Kartogramy.
Wykresy mapowe (kartogramy) przedstawiają terytorialne rozmieszczenie zbiorowości lub zjawiska. Są one budowane w oparciu o mapę i zwykle łączą w sobie równocześnie elementy wykresów liniowych, powierzchniowych, punktowych lub obrazkowych.
Wykresy mapowe wykorzystywane są do prezentacji wielkości oraz natężenia ( na jednostkę powierzchni lub też na 1000 ludności) danego zjawiska w wyodrębnionych jednostkach terytorialnych. Jest to znana i powszechnie stosowana forma graficznej prezentacji zbiorowości lub zjawisk.