Testowanie hipotez odbywa się za pomocą analizy statystycznej. Istotność statystyczną obliczono za pomocą wartości p, która wskazuje wielkość prawdopodobieństwa wyników badań pod warunkiem, że pewne stwierdzenia (hipoteza zerowa) są prawdziwe. Jeśli wartość p jest mniejsza niż wcześniej określony poziom istotności (na ogół 0,05), badacz może stwierdzić, że hipoteza zerowa nie jest prawdziwa i zaakceptować hipotezę alternatywną. Korzystając z prostego testu t, można obliczyć wartość p i określić istotność między dwoma różnymi zestawami danych.
Krok
Część 1 z 3: Konfiguracja eksperymentów
Krok 1. Ustal hipotezę
Pierwszym krokiem w analizie istotności statystycznej jest określenie pytania badawczego, na które chcesz odpowiedzieć i sformułowanie hipotezy. Hipoteza to stwierdzenie dotyczące danych eksperymentalnych i wyjaśnia możliwe różnice w badanej populacji. Dla każdego eksperymentu należy ustalić hipotezę zerową i hipotezę alternatywną. Ogólnie rzecz biorąc, porównujesz dwie grupy, aby sprawdzić, czy są takie same, czy różne.
- Hipoteza zerowa (H0) ogólnie stwierdza, że nie ma różnicy między tymi dwoma zestawami danych. Przykład: grupa uczniów, którzy przeczytali materiał przed rozpoczęciem zajęć, nie uzyskała lepszych ocen niż grupa, która nie przeczytała materiału.
- Hipoteza alternatywna (Ha) to stwierdzenie sprzeczne z hipotezą zerową i takie, które próbujesz poprzeć danymi eksperymentalnymi. Przykład: grupa uczniów, którzy przeczytali materiał przed zajęciami, otrzymała lepsze oceny niż grupa, która nie przeczytała materiału.
Krok 2. Ogranicz poziom istotności, aby określić, jak unikalne muszą być Twoje dane, aby można je było uznać za istotne
Poziom istotności (alfa) to próg używany do określenia istotności. Jeżeli wartość p jest mniejsza lub równa poziomowi istotności, dane uznaje się za statystycznie istotne.
- Z reguły poziom istotności (alfa) jest ustawiony na 0,05, co oznacza, że prawdopodobieństwo, że obie grupy danych będą sobie równe, wynosi tylko 5%.
- Zastosowanie wyższego poziomu ufności (niższa wartość p) oznacza, że wyniki eksperymentalne będą uważane za bardziej znaczące.
- Jeśli chcesz zwiększyć poziom ufności swoich danych, obniż wartość p bardziej do 0,01. Niższe wartości p są powszechnie używane w produkcji przy wykrywaniu wad produktu. Wysoki poziom pewności jest niezbędny, aby każda wyprodukowana część spełniała swoją funkcję.
- W przypadku eksperymentów testowania hipotez akceptowalny jest poziom istotności 0,05.
Krok 3. Zdecyduj się na zastosowanie testu jednostronnego lub testu dwustronnego
Jednym z założeń wykorzystywanych podczas wykonywania testu t jest to, że dane są rozłożone normalnie. Dane, które mają rozkład normalny, utworzą krzywą dzwonową, przy czym większość danych będzie znajdować się w środku krzywej. Test t to test matematyczny używany do sprawdzenia, czy dane znajdują się poza rozkładem normalnym, poniżej lub powyżej „ogonu” krzywej.
- Jeśli nie masz pewności, czy Twoje dane są poniżej lub powyżej grupy kontrolnej, użyj testu dwustronnego. Ten test sprawdzi znaczenie obu kierunków.
- Jeśli znasz kierunek trendu swoich danych, skorzystaj z testu jednostronnego. Korzystając z poprzedniego przykładu, spodziewałeś się, że ocena ucznia wzrośnie. Dlatego powinieneś użyć testu jednostronnego.
Krok 4. Określ wielkość próby za pomocą testowo-statystycznej analizy mocy
Siła statystyki testowej to prawdopodobieństwo, że określony test statystyczny może dać poprawny wynik przy określonej wielkości próby. Próg mocy testowej (lub) wynosi 80%. Analiza siły testu statystycznego może być skomplikowana bez wstępnych danych, ponieważ będziesz potrzebować informacji o szacowanej średniej każdego zestawu danych i jego odchyleniu standardowym. Skorzystaj z kalkulatora statystycznej analizy mocy testu online, aby określić optymalną wielkość próbki dla swoich danych.
- Badacze na ogół przeprowadzają badania pilotażowe jako materiał do statystycznej analizy wytrzymałościowej i jako podstawa do określenia wielkości próbki potrzebnej do większych i bardziej kompleksowych badań.
- Jeśli nie masz środków na przeprowadzenie badania pilotażowego, oszacuj średnią na podstawie literatury i innych przeprowadzonych badań. Ta metoda dostarczy informacji do określenia wielkości próbki.
Część 2 z 3: Obliczanie odchylenia standardowego
Krok 1. Użyj wzoru na odchylenie standardowe
Odchylenie standardowe (znane również jako odchylenie standardowe) jest miarą rozkładu danych. Odchylenie standardowe dostarcza informacji o podobieństwie każdego punktu danych w Twojej próbce. Na początku równanie odchylenia standardowego może wydawać się skomplikowane, ale poniższe kroki pomogą w procesie obliczeń. Wzór na odchylenie standardowe to s = ((xi –)2/(N – 1)).
- s to odchylenie standardowe.
- oznacza, że musisz zsumować wszystkie zebrane wartości próbek.
- xi reprezentuje wszystkie indywidualne wartości twoich punktów danych.
- to średnia danych dla każdej grupy.
- N to liczba twoich próbek.
Krok 2. Oblicz średnią próbki w każdej grupie
Aby obliczyć odchylenie standardowe, należy najpierw obliczyć średnią próbki w każdym zestawie danych. Średnia oznaczona jest grecką literą mu lub. Aby to zrobić, zsumuj wszystkie wartości punktów danych próbki i podziel przez liczbę próbek.
- Na przykład, aby uzyskać średni wynik dla grupy uczniów, którzy przeczytali materiał przed zajęciami, spójrzmy na przykładowe dane. Dla uproszczenia użyjemy 5 punktów danych: 90, 91, 85, 83 i 94.
- Dodaj wszystkie przykładowe wartości: 90 + 91 + 85 + 83 + 94 = 443.
- Podziel przez liczbę próbek, N = 5:443/5 = 88, 6.
- Średnia ocen dla tej grupy wyniosła 88,6.
Krok 3. Odejmij każdą przykładową wartość punktu danych od wartości średniej
Drugim krokiem jest ukończenie części (xi –) równanie. Odejmij każdą wartość punktu danych próbki od wstępnie obliczonej średniej. Kontynuując poprzedni przykład, musisz wykonać pięć odejmowań.
- (90 – 88, 6), (91-88, 6), (85 – 88, 6), (83 – 88, 6) i (94 – 88, 6).
- Uzyskane wartości to 1, 4, 2, 4, -3, 6, -5, 6 i 5, 4.
Krok 4. Podnieś do kwadratu każdą uzyskaną wartość i dodaj je wszystkie
Podnieś do kwadratu każdą obliczoną wartość. Ten krok usunie wszelkie liczby ujemne. Jeśli po wykonaniu tego kroku występuje wartość ujemna lub czas po wykonaniu wszystkich obliczeń, być może zapomniałeś o tym kroku.
- Korzystając z poprzedniego przykładu otrzymujemy wartości 1, 96, 5, 76, 12, 96, 31, 36 i 29,16.
- Dodaj wszystkie wartości: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Krok 5. Podziel przez liczbę próbek minus 1
Formuła wyraża N-1 jako korektę, ponieważ nie liczysz całej populacji; Pobierasz tylko próbkę populacji, aby dokonać oszacowania.
- Odejmij: N – 1 = 5 – 1 = 4
- Podziel: 81, 2/4 = 20, 3
Krok 6. Oblicz pierwiastek kwadratowy
Po podzieleniu przez liczbę próbek minus jeden oblicz pierwiastek kwadratowy z wartości końcowej. To jest ostatni krok do obliczenia odchylenia standardowego. Istnieje kilka programów statystycznych, które mogą obliczyć odchylenie standardowe po wprowadzeniu nieprzetworzonych danych.
Na przykład odchylenie standardowe wyników dla grupy uczniów, którzy przeczytali materiał przed rozpoczęciem zajęć, wynosi: s =√20, 3 = 4, 51
Część 3 z 3: Określanie znaczenia
Krok 1. Oblicz wariancję między dwiema grupami próbek
W poprzednim przykładzie obliczyliśmy tylko odchylenie standardowe jednej grupy. Jeśli chcesz porównać dwie grupy, powinieneś mieć dane z tych dwóch grup. Oblicz odchylenie standardowe drugiej grupy i wykorzystaj wyniki do obliczenia wariancji między dwiema grupami w eksperymencie. Wzór na wariancję to sD = ((s1/N1) + (s2/N2)).
- sD jest wariancją międzygrupową.
- s1 to odchylenie standardowe grupy 1 i N1 to liczba próbek w grupie 1.
- s2 to odchylenie standardowe grupy 2 i N2 to liczba próbek w grupie 2.
-
Na przykład dane z grupy 2 (uczniowie, którzy nie czytali materiału przed rozpoczęciem zajęć) mają liczebność próby 5 z odchyleniem standardowym 5,81. Następnie wariant:
- sD = ((s1)2/N1) + ((s2)2/N2))
- sD = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Krok 2. Oblicz wartość testu t swoich danych
Wartość testu t umożliwi porównanie jednej grupy danych z inną grupą danych. Wartość t umożliwia wykonanie testu t w celu określenia, jak bardzo prawdopodobieństwo, że dwie porównywane grupy danych są znacząco różne. Wzór na wartość t to: t = (µ1 –2)/sD.
- ️1 jest średnią z pierwszej grupy.
- ️2 to średnia wartość drugiej grupy.
- sD jest wariancją między dwiema próbkami.
- Użyj większej średniej jako1 więc nie otrzymujesz wartości ujemnych.
- Na przykład średni wynik grupy 2 (uczniowie, którzy nie czytają) wynosi 80. Wartość t wynosi: t = (µ1 –2)/sD = (88, 6 – 80)/3, 29 = 2, 61.
Krok 3. Określ stopnie swobody próbki
Przy stosowaniu wartości t stopnie swobody są określane przez wielkość próbki. Dodaj liczbę próbek z każdej grupy, a następnie odejmij dwie. Na przykład stopnie swobody (d.f.) wynoszą 8, ponieważ w pierwszej grupie jest pięć próbek, a w drugiej pięć próbek ((5 + 5) – 2 = 8).
Krok 4. Użyj tabeli t do określenia istotności
Tabele wartości t i stopni swobody można znaleźć w standardowych książkach statystycznych lub w Internecie. Spójrz na wiersz pokazujący stopnie swobody wybrane dla danych i znajdź odpowiednią wartość p dla wartości t uzyskanej z obliczeń.
O stopniach swobody 8 d.f. a wartość t 2,61, wartość p dla testu jednostronnego wynosi od 0,01 do 0,025. Ponieważ zastosowaliśmy poziom istotności mniejszy lub równy 0,05, dane, których używamy, dowodzą, że obie grupy danych są istotnie inny znaczący. Dzięki tym danym możemy odrzucić hipotezę zerową i przyjąć hipotezę alternatywną: grupa uczniów, którzy przeczytali materiał przed rozpoczęciem zajęć, uzyskała lepsze wyniki niż grupa uczniów, którzy materiału nie przeczytali
Krok 5. Rozważ przeprowadzenie badania uzupełniającego
Wielu badaczy przeprowadza małe badania pilotażowe, aby pomóc im zrozumieć, jak projektować większe badania. Przeprowadzanie dalszych badań z większą liczbą pomiarów zwiększy Twoją pewność co do wniosków.