W statystyce częstotliwość bezwzględna to liczba wyrażająca liczbę wartości w zestawie danych. Częstotliwość skumulowana to nie to samo, co częstotliwość bezwzględna. Częstotliwość skumulowana to ostateczna suma (lub najnowsza suma) wszystkich częstotliwości do pewnego stopnia w zbiorze danych. Te wyjaśnienia mogą wydawać się skomplikowane, ale nie martw się: ten temat będzie łatwiejszy do zrozumienia, jeśli dostarczysz papier i długopis i popracujesz nad przykładowymi problemami opisanymi w tym artykule.
Krok
Część 1 z 2: Obliczanie zwykłej częstotliwości skumulowanej
Krok 1. Sortuj wartości w zestawie danych
„Zbiór danych” to grupa liczb opisujących stan rzeczy. Sortuj wartości znajdujące się w zestawie danych od najmniejszej do największej.
Przykład: Zbierasz dane o liczbie książek przeczytanych przez każdego ucznia w ciągu ostatniego miesiąca. Otrzymane dane, posortowane od najmniejszego do największego, to: 3, 3, 5, 6, 6, 6, 8
Krok 2. Oblicz bezwzględną częstotliwość każdej wartości
Częstotliwość wartości to liczba wartości, jakie ma ona w zbiorze danych (częstotliwość tę można nazwać „częstotliwością bezwzględną”, aby nie mylić z częstotliwością skumulowaną). Najłatwiejszym sposobem obliczenia częstotliwości jest utworzenie tabeli. Wpisz „Wartość” (lub co ta wartość mierzy) w górnym wierszu pierwszej kolumny. Wpisz „Częstotliwość” w górnym wierszu drugiej kolumny. Wypełnij tabelę zgodnie z zestawem danych.
- Przykład: wpisz „Liczba książek” w górnym wierszu pierwszej kolumny. Wpisz „Częstotliwość” w górnym wierszu drugiej kolumny.
- W drugim wierszu wpisz pierwszą wartość, czyli „3”, pod „Liczba książek”.
- Policz liczbę 3 w zestawie danych. Ponieważ są dwie trójki, wpisz „2” pod „Częstotliwość” (w drugim wierszu).
-
Wstaw wszystkie wartości do tabeli:
- 3 | F = 2
- 5 | F = 1
- 6 | F = 3
- 8 | F = 1
Krok 3. Oblicz skumulowaną częstotliwość pierwszej wartości
Częstotliwość skumulowana to odpowiedź na pytanie „ile razy w zbiorze danych pojawia się ta lub mniejsza wartość?” Obliczanie skumulowanej częstotliwości musi zaczynać się od najmniejszej wartości. Ponieważ żadna wartość nie jest mniejsza niż najmniejsza wartość, skumulowana częstotliwość tej wartości jest równa jej bezwzględnej częstotliwości.
-
Przykład: Najmniejsza wartość w zbiorze danych to 3. Liczba uczniów czytających 3 książki to 2 osoby. Żaden uczeń nie czyta mniej niż 3 książki. Tak więc skumulowana częstotliwość pierwszej wartości wynosi 2. Wpisz „2” obok częstotliwości pierwszej wartości, w tabeli:
3 | F = 2 | Fkum=2
Krok 4. Oblicz skumulowaną częstotliwość następnej wartości w tabeli
Właśnie policzyliśmy, ile razy najmniejsza wartość pojawia się w zestawie danych. Aby obliczyć skumulowaną częstotliwość następnej wartości, dodaj bezwzględną częstotliwość tej wartości do skumulowanej częstotliwości poprzedniej wartości.
-
Przykład:
-
3 | F = 2 | Fkum =
Krok 2.
-
5 | F =
Krok 1. | Fkum
Krok 2
Krok 1. = 3
-
Krok 5. Powtórz procedurę, aby obliczyć skumulowaną częstotliwość wszystkich wartości
Oblicz skumulowaną częstość każdej kolejnej wartości: dodaj bezwzględną częstość wartości do skumulowanej częstości poprzedniej wartości.
-
Przykład:
-
3 | F = 2 | Fkum =
Krok 2.
-
5 | F = 1 | Fkum = 2 + 1 =
Krok 3.
-
6 | F = 3 | Fkum = 3 + 3 =
Krok 6.
-
8 | F = 1 | Fkum = 6 + 1 =
Krok 7.
-
Krok 6. Sprawdź odpowiedzi
Po zakończeniu obliczania skumulowanej częstotliwości największej wartości, liczba każdej wartości została zsumowana. Ostateczna skumulowana częstotliwość jest równa liczbie wartości w zestawie danych. Sprawdź to za pomocą jednej z następujących metod:
- Zsumuj bezwzględne częstotliwości wszystkich wartości: 2 + 1 + 3 + 1 = 7. Tak więc „7” jest ostateczną częstotliwością skumulowaną.
- Policz liczbę wartości w zestawie danych. Zestaw danych w przykładzie to 3, 3, 5, 6, 6, 6, 8. Jest 7 wartości. Tak więc „7” to ostateczna częstotliwość skumulowana.
Część 2 z 2: Robienie bardziej skomplikowanych problemów
Krok 1. Poznaj dane dyskretne i ciągłe
Dane dyskretne w postaci jednostek, które można obliczyć, a każda jednostka nie może być ułamkiem. Dane ciągłe opisują coś, czego nie można obliczyć, a wyniki pomiarów mogą mieć postać ułamków/dziesiętnych w dowolnych jednostkach. Przykład:
- Liczba psów to dane dyskretne. Liczba psów nie może być „połowa psa”.
- Grubość śniegu to dane ciągłe. Głębokość śniegu zwiększa się stopniowo, nie jedna jednostka na raz. Przy pomiarze w centymetrach głębokość śniegu może wynosić 142,2 cm.
Krok 2. Pogrupuj dane ciągłe w zakresy
Ciągłe zestawy danych często składają się z wielu unikalnych wartości. Stosując opisaną powyżej metodę, otrzymana tabela końcowa może być bardzo długa i trudna do zrozumienia. Dlatego utwórz określony zakres wartości w każdym wierszu. Odległość między poszczególnymi zakresami musi być taka sama (np. 0-10, 11–20, 21–30 itd.), niezależnie od tego, ile wartości znajduje się w każdym zakresie. Poniżej znajduje się przykład ciągłego zbioru danych zapisanego w formie tabelarycznej:
- Zestaw danych: 233, 259, 277, 278, 289, 301, 303
-
Tabela (pierwsza kolumna to wartość, druga kolumna to częstotliwość, trzecia kolumna to częstotliwość skumulowana):
- 200–250 | 1 | 1
- 251–300 | 4 | 1 + 4 = 5
- 301–350 | 2 | 5 + 2 = 7
Krok 3. Utwórz wykres liniowy
Po obliczeniu skumulowanej częstotliwości przygotuj papier milimetrowy. Narysuj wykres liniowy z osią x jako wartościami w zestawie danych i osią y jako skumulowaną częstotliwością. Ta metoda ułatwia dalsze obliczenia.
- Przykład: jeśli zestaw danych to 1-8, utwórz oś x z ośmioma znacznikami. Przy każdej wartości na osi x narysuj punkt odpowiadający wartości na osi y, zgodnie z skumulowaną częstotliwością tej wartości. Połącz pary sąsiednich kropek liniami.
- Jeśli w zestawie danych nie ma określonej wartości, częstotliwość bezwzględna wynosi 0. Dodanie 0 do ostatniej częstotliwości skumulowanej nie zmienia wartości. Narysuj więc punkt o tej samej wartości y co ostatnia wartość.
- Ponieważ skumulowana częstotliwość jest wprost proporcjonalna do wartości w zestawie danych, wykres liniowy zawsze zwiększa się w prawym górnym rogu. Jeśli wykres liniowy opada, możesz zobaczyć kolumnę częstotliwości bezwzględnej zamiast częstotliwości skumulowanej.
Krok 4. Znajdź wartość mediany za pomocą wykresu liniowego
Mediana to wartość znajdująca się w samym środku zestawu danych. Połowa wartości w zestawie danych znajduje się powyżej mediany, a pozostała połowa poniżej mediany. Oto jak znaleźć wartość mediany na wykresie liniowym:
- Zwróć uwagę na ostatnią kropkę po prawej stronie wykresu liniowego. Wartość y punktu to całkowita skumulowana częstotliwość, czyli liczba wartości w zbiorze danych. Na przykład całkowita skumulowana częstotliwość zbioru danych wynosi 16.
- Podziel całkowitą skumulowaną częstotliwość przez 2, a następnie znajdź położenie podzielonej liczby na osi y. W tym przykładzie 16 podzielone przez 2 równa się 8. Znajdź „8” na osi y.
- Znajdź punkt na wykresie liniowym, który jest równoległy do wartości y. Palcem narysuj linię prostą w bok od pozycji „8” na osi y, aż dotknie wykresu liniowego. Punkt dotknięty palcem na wykresie liniowym przekroczył połowę zbioru danych.
- Znajdź wartość x punktu. Palcem narysuj linię prostą w dół od punktu na wykresie liniowym, aż dotknie osi x. Punkt dotknięty palcem na osi x jest medianą zbioru danych. Na przykład, jeśli znaleziona wartość mediany wynosi 65, połowa zestawu danych jest poniżej 65, a druga połowa powyżej 65.
Krok 5. Znajdź wartość kwartyla za pomocą wykresu liniowego
Wartości kwartylowe dzielą zbiór danych na cztery części. Metoda znajdowania wartości kwartyla jest prawie taka sama jak metoda znajdowania wartości mediany; po prostu sposób na znalezienie innej wartości y:
- Aby znaleźć dolną wartość y kwartyla, podziel całkowitą skumulowaną częstość przez 4. Wartość x, która jest koordynowana z wartością y, jest wartością dolnego kwartyla. Jedna czwarta zbioru danych znajduje się poniżej wartości dolnego kwartyla.
- Aby znaleźć wartość y z górnego kwartyla, pomnóż całkowitą skumulowaną częstotliwość przez. Wartość x, która koordynuje się z wartością y, jest wartością górnego kwartyla. Trzy czwarte zbioru danych znajduje się poniżej wartości górnego kwartyla, a pozostała ćwiartka znajduje się powyżej wartości górnego kwartyla. całego zestawu danych.