poniedziałek, 25 lutego 2013

Przygotowanie danych empirycznych do obliczeń i obliczenia statystyczne

Czynności te przybliżymy na przykładzie badań ankietowych. Pierwszą czynnością po zebraniu ankiet jest przejrzenie każdej z nich i ponumerowanie, po wyłączeniu ankiet bezwartościowych. Należą do nich takie, w których respondenci nie wypełnili tzw. metryczki (załącznik). Dlatego warto o tym przypomnieć przed rozpoczęciem badań. Może się zdarzyć, że któraś z ankiet nie ma wypełnionego jakiegoś pytania merytorycznego. Nie dyskwalifikuje to jednak tej ankiety, natomiast może ją dyskwalifikować podejrzenie, że była wypełniana mechanicznie.
 
W wyniku przeprowadzonych badań terenowych, opierając się na przyjętych metodach i technikach oraz opracowanych narzędziach badawczych, uzyskujemy konkretne materiały empiryczne. Najogólniej biorąc, zebrany w badaniach materiał może mieć trojaką postać:
 
1) zdań opisowych,
2) cyfr (liczb) oraz
3) połączenia cyfr (liczb) i zdań opisowych.

Formę zdań opisowych mogą mieć, na przykład materiały z wywiadów swobodnych czy też z obserwacji, chociaż nierzadko się zdarza, że materiał z obserwacji posiada również konkretne dane liczbowe.
 
Materiały w postaci zdań opisowych mogą być wykorzystywane w dwojaki sposób:
  1. do analiz jakościowych lub
  2. do analiz ilościowych.

W pierwszym przypadku, dotyczącym analiz jakościowych, zapoznajemy się z wypowiedziami respondentów lub z innymi informacjami za-pisanymi na papierze, taśmie magnetofonowej czy magnetowidowej, przeprowadzamy ich analizę i syntezę oraz wyciągamy wnioski.
 
W drugim przypadku, dotyczącym analiz ilościowych, materiały w postaci zdań opisowych przekształcamy na odpowiedni zapis cyfrowy. Operacja ta jest nazywana kodowaniem. Wykorzystujemy do tego celu tzw. klucz kodowy*.
 
Z materiałem empirycznym w postaci cyfr (liczb) mamy zazwyczaj do czynienia na etapie wykonywania określonych operacji i obliczeń statystycznych. Obliczenia te jeszcze stosunkowo niedawno wykonywano tzw. metodą ręczną, za pomocą kalkulatora i odpowiednio skonstruowanych ta-bel. Zdarza się, że ten sposób pracy z danymi empirycznymi spotykamy jeszcze dziś. Jednak coraz częściej do tego celu wykorzystujemy komputer*.
 
Warto dodać, że po wprowadzeniu wszystkich danych do pamięci komputera wydajemy mu odpowiednie polecenia, nakazujące wykonanie odpowiednich obliczeń i przedstawienie wyników tych obliczeń na ekranie monitora bądź w postaci wydruków. Z tego wynika, że z danymi liczbowymi mamy również do czynienia wówczas, kiedy otrzymujemy, na przykład wydruki z komputera, zanim przystąpimy do ich opisania lub przetworzenia na wykresy czy inne formy wizualne, stanowiące doskonałą pomoc do analiz i wnioskowania. 

Zanim jednak komputer przetworzy nam dane cyfrowe na wykresy, możemy zażądać ich przedstawienia w dwóch najczęściej wykorzystywanych postaciach: w postaci tzw. frekwencji lub w postaci tabel krostabulacyjnych, zwanych też tabelami korelacyjnymi.
 
Pracę z wykorzystaniem danych zbiorczych obliczonych przez komputer zaczynamy od analiz danych w postaci tzw. frekwencji. Są to zsumowane odpowiedzi na każde z pytań zawartych w kwestionariuszu ankiety. Materiał empiryczny w takiej postaci wykorzystujemy do wstępnych analiz. Dane te najlepiej jest wpisać do czystego, niewypełnionego kwestionariusza ankiety. 

Otrzymujemy w ten sposób sumaryczne dane za całą objętą badaniami próbę populacji. Jak już wspomniano, dane w postaci frekwencji wykorzystujemy: po pierwsze do wstępnych analiz, służących do opisania badanej rzeczywistości; po drugie – na podstawie tych danych, zwanych również sumami marginesowymi oraz opierając się na przyjętych w koncepcji badań założeniach, podejmujemy decyzję, jakie powinny być wykonane krostabulacje. 

Praktycznie oznacza to wybór tych zmiennych, między którymi chcemy poznać łączące je relacje i zależności. Wydając odpowiednie polecenie komputerowi, to znaczy wprowadzając do jego pamięci polecenie, między którymi zmiennymi korelacje interesują nas, komputer wykonuje odpowiednie operacje, a ich wyniki prezentuje w postaci tabel korelacyjnych, zwanych również krostabulacyjnymi i wykresów.
 
Warto zwrócić uwagę, że poza rozkładem odpowiedzi zawartych w tabelach korelacyjnych, arkusze te zawierają również wiele ciekawych informacji szczegółowych, umieszczonych pod tabelami. Są tam przedstawione różne wskaźniki statystyczne. Jeden z nich spełnia rolę szczególną. Pozwala bowiem jednym rzutem oka określić czy tabela zawiera dane, którymi się warto zajmować, czy też są to po prostu śmieci. Wskaźnikiem tym jest oznaczony symbolem „p”, tzw. poziom istotności związku korelacyjnego. Przedmiotem naszych analiz stają się tabele krostabulacyjne, przy których wskaźnik poziomu istotności związku korelacyjnego wynosi p < 0,05.
 
Współczynnikami korelacji wykorzystywanymi w naszych analizach są często: współczynnik korelacji Pearsona, oznaczany symbolem „r”, lub współczynnik korelacji rangowej Spearmana – „rs”. Zainteresowanych tymi zagadnieniami odsyłamy do odpowiednich pozycji literatury[1].
 
Wróćmy jeszcze do wymienionych na początku trzech form – albo inaczej – trzech postaci materiału empirycznego, tzn. zdań opisowych, cyfr (liczb) oraz połączenia cyfr (liczb) i zdań opisowych. Kombinacja tych trzech postaci materiału empirycznego, ujętych w formie tabel, zestawień, wykresów i rysunków jest podstawą do analiz i wnioskowania.
 
Stopień wykorzystania zebranego w badaniach materiału empirycznego zależy od kilku czynników. Są nimi: jakość zebranego materiału, uwarunkowana z kolei od zastosowanych metod, technik i narzędzi badawczych, a także od wiedzy i umiejętności badacza, w tym również znajomości i umiejętności wykorzystania odpowiednich metod statystycznych*.

* Technika przygotowania i wykorzystania klucza kodowego oraz sposoby wpro-wadzania do komputera danych cyfrowych z badań empirycznych, zostaną przedstawione w oddzielnym skrypcie.

[1] Na przykład: G.A. Ferguson, Y. Tanake, Analiza statystyczna... wyd. cyt.; J.P. Guilford, Podstawowe metody statystyczne w psychologii i pedagogice, Warszawa 1964; Metody statystyczne w socjologii, red. K. Szaniawski, Warszawa 1968; A. Góralski, Metody opisu i wnioskowania statystycznego w psychologii i pedagogice, Warszawa 1987.

* Bardziej szczegółowo kwestie te zostaną przedstawione w skrypcie, który jest opracowywany w Wydziale Lotnictwa i OP. Będzie on zawierał elementy statystyki na potrzeby badań empirycznych, a także przykłady analizy danych empirycznych i wnioskowania statystycznego.

Brak komentarzy:

Prześlij komentarz

Uwaga: tylko uczestnik tego bloga może przesyłać komentarze.