---
title: "Statystyka I z R - kolokwium z testowania hipotez (ćwiczenia)"
author: "Bartosz"
date: "2026-01-07"
output: html_document
editor_options: 
  chunk_output_type: console
---

## Uwagi ogólne

1. W zadaniach pojawia się formuła "przeprowadź odpowiedni test i opisz wyniki". Oznacza to, że nie wystarczy po prostu napisać kodu, ale należy opisać wyniki w stylu APA. Ścisłe przestrzeganie wytycznych APA nie będzie oceniane, ale będę sprawdzał, czy w odpowiedzi znajdują się informacje, które powinny się w opisie znaleźć: 
  - ogólny opis wyników wraz z podaniem ewentualnego kierunku różnicy lub relacji;
  - statystyki deskryptywne (prawdopodobieństwa, średnie, odchylenia, wspólczynniki korelacji, współczynniki regresji, itp.);
  - statystyki inferencyjne (wartość statystyki testowej, rozkład służący do testowanie, prawdopodobieństwo testowe);
  - obliczenie i zaraportowanie wielkości efektu dla każdego testu nie jest obligatoryjne, ale można za nie dostać dodatkowe punkty.
2. W przypadku testów posiadających wersje kierunkowe należy według preferencji użyć wersji kierunkowej odpowiadającej treści zadania lub wersji dwustronnej (*two-tailed*).
3. Statystyki można obliczać dowolną metodą; w szczególności dozwolone jest korzystanie z pakietu `dplyr`.
4. Jeżeli zadanie wymaga stworzenie wizualizacji danych, można ją stworzyć dowolną metodą (bazowe wykresy R, `ggplot2`, `ggpubr`).

## Zadanie 1 (test dwumianowy) (1 pkt)

W finałach mistrzostw świata w *League of Legends* w 2023 roku rozegrano 79 mecze. W grze tej w meczu mierzą się dwie drużyny. Drużyny mają swoją bazę po dwóch stronach mapy. Okazuje się, że drużyny, których baza znajduje się po stronie czerwonej wygrały w 32 meczach, podczs gdy zespoły po stronie niebieskiej wygrały w aż 47 meczach. 

Czy mamy podstawy sądzić, że zespoły po stronie niebieskiej mają wyższą niż 50% szansę na zwycięstwo? Przeprowadź odpowiedni test i opisz wyniki.

```{r}
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*

## Zadanie 2 (test $z$) (1 pkt)

Jarmakowski-Kostrzanowski i Jarmakowska-Kostrzanowska (2016) skonstruowali polską adaptację Kwestionariusza Kodów Moralnych stworzonego przez Grahama i Haidta. Według teorii, na której oparty jest ten kwestionariusz, wyróżnia się pięć fundamentów moralnych: Troskę, Sprawiedliwość, Lojalność, Autorytet i Świętość. Badacze ustalili, że jeśli chodzi o kod moralny Autorytetu, średni wynik w populacji polski wynosi 2.68 z odchyleniem standardowym 0.92 (na skali 0-5). Pewien student kognitywistyki przeprowadził badanie na 67 osobach studiujących filozofię. W przebadanej przez niego próbie średnia wynosiła 2.21 z odchyleniem standardowym 1.12. 

Czy mamy podstawy sądzić, że studenci filozofii mniej cenią sobie moralną wagę autorytetu, niż ogólna populacja? Przeprowadź odpowiedni test i opisz wyniki.

```{r}                
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 3 (test zgodności $\chi^2$) (1 pkt)

W grze *Starcraft* gracze mierzą się w pojedynkach 1 na 1. Każdy gracz może wybrać jedną z trzech dostępnych ras - *Protosów*, *Terran* lub *Zergów*. W sezonie 55 rozgrywek na poziomie ligi *Platinum* wybierano dostępne rasy z następującą częstością:

- Terranie: 6885 razy
- Zergowie: 6668 razy 
- Protosi: 6081 razy

Czy prawdopodobieństwo wyboru każdej z ras jest równe? Przeprowadź odpowiedni test i opisz wyniki.

```{r}
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*

## Zadanie 4 (test niezależności $\chi^2$) (1 pkt)

W 1929 roku Beckham przeprowadziła badanie dotyczące czarnych amerykanów. Dane znajdują się w pliku `Beckham(1929).csv` Każdemu badanemu zadał trzy pytania;
1. Czy uważasz, że czarni amerykanie są szczęśliwi?
2. Czy osobiście jesteś szczęśliwą osobą jako czarny amerykanin?
3. Czy czarni amerykanie powinni być szczęśliwi?

W pliku z danymi odpowiedzi podzielone są na kategorie według wykonywanego zawodu. Przeprowadź 3 testy $\chi^2$ (jeden dla każdego pytania) sprawdzające, czy odpowiedź na dane pytanie zależy od profesji i zinterpretuj wyniki swoich analiz.

```{r}
beckham <- read.delim("Beckham(1929).dat", header = T)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 5 (test $t$ Studenta dla jednej próby) (1 pkt)

Pewna grupa radykalnych językoznawców zastanawiała się nad semantyką nierzeczywistych okresów warunkowych. Zgodnie z pewną teorią z zakresu filozofii, następnik w takim zdaniu warunkowym oceniany jest w świecie możliwym wyznaczonym przez poprzednik. Na przykład:

> "Gdyby kangury nie miały ogonów, to wywracałyby się"

Ocenę tego, czy kangury wywracałyby się, czy nie, dokonujemy z perspektywy świata możliwego, w którym nie mają ogonów.

Sytuacja komplikuje się, jeśli rozważymy zdania, w których występuje zaimek osobowy. Badacze chcieli sprawdzić, co się dzieje, jeśli poprzednik wyznacza sytuacje, w której zmienił się rodzaj gramatyczny jednego z referentów. W tym celu skonstruowali prostą historyjkę, którą prezentowali badanym.

> Paweł i Pola pojechali wspólnie w góry. Po dwóch dniach odpoczynku Pola powiedziała Pawłowi, że pisała poprzedniego dnia z Kasią, przyjaciółką Poli, która od jakiegoś czasu rozważała, poddanie się operacji zmiany płci. Pola opowiadała Pawłowi, że Kasia niepokoiła się, kiedy będą mogli i chcieli się zobaczyć w trójkę po zabiegu... Pola mówi więc Pawłowi:

> (Z) Jeżeli Kasią podda się tranzycji, to pójdziemy się z nim jak najszybciej spotkać.

Badani byli proszeni o wskazanie, czy zdanie (Z) jest dla nich akceptowalne. Odpowiedzi udzielali na skali 7 punktowej od -3 (całkowicie nieakceptowalne) do +3 (całkowicie akceptowalne). W zbiorze danych `p_and_p` znajdują się oceny 30 rodzimych użytkowników języka polskiego. 

Czy zdanie (Z) możemy uznać za akceptowalne? Przeprowadź odpowiedni test, opisz i zinterpretuj jego wyniki.


```{r}
p_and_p <- c(1, -1, 0, -1, 3, 0, -1, 1, 2, 1, -2, 0, 2, -1, -1, 1,
             2, 1, 1, 1, 1, 2, 0, 2, 1, 1, 1, 1, 1, 2)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 7 (test $t$ Studenta dla prób niezależnych) (1 pkt)

W eksperymencie przeprowadzonym przez badaczy-sadystów udział wzięły 24 osoby. Uczestnicy podzieleni zostali na dwie grupy. W pierwszej grupie (n = 12) badani zostali poproszeni aby przez 5 minut bawili się z wielką, owłosioną tarantulą z ogromnymi kłami i nienawistnym spojrzeniem. Pozostali uczestnicy badania (n = 12) podczas 5-minutowej sesji mieli oglądać zdjęcia tej samej tarantuli na ekranie komputera. Następnie wszystkim badanym zmierzono poziom lęku za pomocą odpowiedniego kwestionariusza. 

Czy mamy prawo sądzić, że interakcje z prawdziwą tarantulą zwiększają lęk w porównaniu do obcowania z jej graficzną reprezentacją? Przeprowadź odpowiedni test, przygotuj wizualizację wyników opisz je.

```{r}
spiderLong <- data.frame(Paritcipant = 1:24,
                         Group = c(rep("Picture", 12), rep("Real Spider", 12)),
                         Anxiety = c(30, 35, 45, 40, 50, 35, 55, 25, 30, 45, 40, 50,
                                     40, 35, 50, 55, 65, 55, 50, 35, 30, 50, 60, 39
                                     )
                         )
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 8 (test Wilcoxona) (1 pkt)

Pewna neurolożka postanowiła zbadać wpływ rekreacyjnych narkotyków na objawy depresyjne. W tym celu przetestowała 20 bywalców bywalców klubów. 10 z nich otrzymało tabletkę Ecstasy, którą mieli wziąć w niedzielę. Drugie 10 zostało poproszonych, aby tylko pili alkohol. Poziom depresji mierzony był za pomocą *Beck Depression Inventory* w środę (`wedsBDI`) oraz w niedzielę (`sundayBDI`). Otrzymane przez badaczkę dane nie miały jednak rozkładu normalnego. 

Czy w grupie przyjmującej Ecstasy poziom depresji był wyższy w środę, niż w niedziele? Przeprowadź odpowiedni test, przygotuj wizualizację wyników i opisz rezultaty swoich analiz.

```{r}
drugs <- read.delim("Drug.dat", header = T)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 9 (test $U$ Manna-Whitneya) (1 pkt)

Pewien dociekliwy student postanowił pokazać, że popularna w niektórych kręgach *pop* psychologia czyni ludziom więcej złego niż dobrego i generalnie nie poprawia ich dobrostanu. W tym celu podzielił grupę swoich znajomych (n = 20, wow!) chętnych na udział w eksperymencie losowo na dwie równe grupy. Dane znajdują się w zbiorze danych `Penis.dat` (ukradłem dane z internetu, przepraszam).

Badanych z pierwszej grupy poprosił o przeczytanie "Jedyny taki coach. Sekretny system przełamywania barier na drodze do sukcesu" Briana Tracy'ego (`book = 1`). Badani w drugiej grupie zostali poproszeni o lekturę "Madame" Antoniego Libery (`book = 2`). Następnie po lekturze poprosił swoich uczestników o wypełnienie kwestionariusza mierzącego aktualny poziom szczęścia w życiu.

Czy czytanie podejrzanych książek o samodoskonaleniu sprawia, że jesteśmy szczęśliwsi? Przeprowadź odpowiedni test, przygotuj wizualizację wyników i opisz rezultaty swoich analiz.

```{r}
penis <- read.delim("Penis.dat", header = T)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 10 (test dla współczynnika korelacji $r$) (1 pkt)

W pakiecie `languageR` znajduje się zbiór danych `ratings`. W zbiorze tym znajdują się dane dotyczące 81 wybranych konkretnych rzeczowników w języku angielskim. W kolumnie `meanSizeRating` znajduje się informacja o estymowanej wielkości obiektu, do którego się odnosi dany rzeczownik (średnia dla wszystkich uczestników eksperymentu). Z kolei w kolumnie `meanWeightRating` znajdziemy estymację wagi obiektów. 

Czy średnie estymacje wagi są skorelowane ze średnimi estymacji wielkości? Przeprowadź odpowiedni test, przygotuj wizualizację danych i opisz wyniki swoich analiz.

```{r}
library(languageR)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*


## Zadanie 11 (regresja liniowa) (2 pkt)

W pakiecie `languageR` znajduje się zbiór danych `ratings`. W zbiorze tym znajdują się dane dotyczące 81 wybranych konkretnych rzeczowników w języku angielskim. W kolumnie `meanSizeRating` znajduje się informacja o estymowanej wielkości obiektu, do którego się odnosi dany rzeczownik (średnia dla wszystkich uczestników eksperymentu). Z kolei w kolumnie `meanFamiliarity` znajdziemy średnią subiektywną (= przeprowadzoną intuicyjnie przez badanych) estymację częstości występowania danego rzeczownika. 

Czy możliwe jest przewidzenie tego, jak ludzie oceniają ciężar danego przedmiotu na podstawie tego, jak często ich zdaniem nazwa tego przedmiotu używana jest w języku?  Odpowiedz na to pytanie na podstawie dopasowanego do danych modelu statystycznego, przygotuj wizualizację danych i opisz wyniki swoich analiz.

```{r}
library(languageR)
# Miejsce na Twój kod
```

*Miejsce na Twoją odpowiedź*