Zadanie 1

Proszę przeczytać stosowny fragment z podręcznika Howella (rozdział 15, s. 508 - 518) i jednocześnie podpatrywać we wrzuconym na stronę notatniku jak robi się wszystkie te rzeczy, o których pisze Howell w R.

Zadanie 2

Zadanie jest bardzo proste. Proszę zobaczyć co by się stało, gdybyśmy zamiast LogPctSAT użyli PctSAT. Jak wpłynęłoby to na nasze \(R^2\), współczynniki regresji oraz istotność statystyczną?

Zadanie 3

Może problem jest nie w tym, że zwiększonie wydatków ma słaby wpływ na jakość kształcenia, ale w tym, że SAT jest kiepskim pomiarem jakości kształcenia? Proszę wykonać taką samą analizę jak w notatniku tylko, że zamiast wyników SAT wykorzystać wyniki ACT (hint: log zwraca logarytm naturalny).

W swoim rozwiązaniu proszę nie tylko stworzyć odpowiednie modele i ,,wydrukować’’ w pliku ich podsumowanie ale również odpowiedzieć na kilka pytań.

  1. Jaki rozkład mają nasze zmienne? Jakie są relacje między nimi? Czy są ze sobą skorelowane? (tutaj poproszę odpowiednie wykresy i obliczenia oprócz odpowiedzi słownych)
  2. Jaka jest relacja między naszymi perdyktorami a zmienną objaśnianą? Czy takiej się spodziewaliśmy, czy nie? Czy sytuacja jest diametralnie różna od analogicznej analizy dla SAT?
  3. Czy nasz model ma wyższy współczynnik \(R^2\) niż ten, który stworzyliśmy dla testu SAT? O czym to świadczy?
  4. Na szóstkę: proszę zastosować poznane techniki diagnostyczne (można doczytać w podręczniku) i powiedzieć, czy zastosowanie regresji liniowej jest uzasadnione.

Odpowiedzi proszę napisać sensowną prozą w taki sposób, żeby odnosiły się do danych i obliczeń w Państwa pliku .Rmd (można to zrobić w tym stylu, w którym ja napisałem w notatniku).