--- title: "Praca domowa (założenia testu t)" author: "Bartosz Maćkiewicz" output: html_document --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = FALSE) ``` # Zadanie I Żebyśmy mogli korzystać z testu t Studenta (oraz z metod pokrewnych: analizy wariancji i regresji liniowej), nasze dane powinny spełniać pewne założenia. Dopiero wtedy mamy prawo się spodziewać, że — przy prawdziwości $H_0$ — statystyka policzona z tych danych ma rozkład w przybliżeniu równy teoretycznemu rozkładowi $t$, i dopiero wtedy możemy z rozkładu teoretycznego skorzystać, by określić wartość p odpowiadającą naszej statystyce. Im bardziej nasze dane odbiegają od założeń, tym mniej dokładne jest to przybliżenie, a zatem tym mniej miarodajna jest wartość $p$ wskazana przez rozkład teoretyczny. W efekcie tracimy kontrolę nad błędem pierwszego rodzaju (wydaje nam się, że prawdopodobieństwo jego popełnienia wynosi np. 5%, podczas gdy dla naszego testu może być ono w rzeczywistości inne). Założenia testu $t$ Studenta (oraz metod pokrewnych: analizy wariancji i regresji liniowej) są w zasadzie dwa: (i) rozkład w populacji powinien być normalny, a w przypadku porównywania dwóch lub więcej średnich (ii) wariancje w populacjach powinny być takie same. Każdy podręcznik do statystyki powie Państwu, że test $t$ Studenta jest względnie odporny na niespełnienie jego założeń. Lepsze podręczniki dodadzą, że owszem, ale pod warunkiem, że testowane grupy są równoliczne. Ale co to właściwie znaczy? Czy w ogóle nie musimy się przejmować założeniami? Kiedy i jak bardzo powinniśmy? Proszę zaproponować prostą symulację (kilka linijek kodu), która pozwoli sprawdzić odporność testu $t$ dla prób niezależnych na heterogeniczność wariancji. Państwa symulacja powinna pozwolić odpowiedzieć na następujące pytania: * jak heterogeniczność wariancji zniekształca poziom α (przy równolicznych grupach), * jak różnice w liczebnościach grup wpływają na to zniekształcenie (zarówno, kiedy liczniejsza grupa pochodzi z populacji o większej wariancji, jak i w sytuacji odwrotnej), * jak bardzo poprawka Welcha niweluje problem heterogeniczności wariancji w powyższych konfiguracjach. Poproszę o odpowiedzi słowne na te pytania tzn. o INTERPRETACJĘ Państwa wyników. ```{r} # Tutaj miejsce na Twój kod ```