Proszę wczytać do R plik UNESCO.csv. Plik ten pochodzi ze strony UNESCO, która za darmo udostępnia wiele zbiorów danych w tym np. dane demograficzne, na których w tej pracy domowej będą Państwo pracować. Po wczytaniu do R danych proszę wykonać następujące zadania:
Następnie proszę za pomocą kodu napisanego w R i używając bibliotek z pakietu tidyverse
(takich jak dplyr
czy tidyr
) wykonać poniższe zadania.
Zadanie 1
W których krajach śmiertelność noworodków w 2005 roku była wyższa niż w 2004 roku? Wynik proszę przedstawić jako ramkę danych z czterema kolumnami:
| kraj | śmiertelność w 2004 | śmiertelność w 2005 | róznica między nimi |
Zadanie 2
W których krajach populacja powyżej 65 roku życia stanowiła więcej niż 15% całości populacji w 2007 roku?
Rozwiązanie należy podać w formie:
| kraj | populacja | populacjastarszych | procent[, jaki stanowi populacja powyżej 65 roku życia] |
Ramka danych ma być posortowana malejąco według proporcji populacji powyżej 65 roku życia do całości populacji (kolumna procent).
Zadanie 3
Proszę za pomocą funkcji dcast
z pakietu reshape2
lub odpowiedniej funkcji pivot_
z pakietu tidyr
stworzyć tabelę dla liczby urodzeń przypadających na jedną kobietę, w której wierszami będą kraje, a kolumnami lata. Wykorzystując tę tabelę proszę sprawdzić, w których krajach liczba urodzeń na kobietę w 2010 roku była niższa niż w 2005 roku? Wynik proszę przedstawić jako wektor krajów.
Zadanie 4
Proszę za pomocą funkcji dcast
z pakietu reshape2
lub odpowiedniej funkcji pivot_
z pakietu tidyr
stworzyć tabelę dla proporcji populacji mieszkającej na wsi, w której wierszami będą kraje, a kolumnami lata. Wykorzystując tę tabelę proszę sprawdzić, w których krajach w okresie objętym tabelą proporcja populacji wiejskiej zmniejszyła się najbardziej? Odpowiedź proszę przygotować w formie ramki danych: | Country | Różnica |
(bardzo ważne żeby były polskie znaki w nazwie kolumny!). Napisany przez Państwa kod powinien wyświetlać tylko 10 krajów z najwiekszą wartościa w kolumnie Różnica
posortowanych malejąco.
Zadanie 5
Proszę za pomocą funkcji dcast
z pakietu reshape2
lub odpowiedniej funkcji pivot_
z pakietu tidyr
stworzyć dwie tabele dla proporcji osób, które mogą przeżyć za 1,90 dolara dziennie oraz za 3,90 dolara, w których wierszami będą kraje, a kolumnami lata. Wykorzystując te tabele proszę sprawdzić, w których krajach w okresie objętym tabelą liczba osób (proporcjonalnie do populacji), które muszą przeżyć za 1,90 dolara dziennie zmniejszyła się najbardziej oraz w których za 3.90 dolara? Odpowiedzi proszę przygotować w formie ramki danych: | Country | Różnica |
(bardzo ważne żeby były polskie znaki w nazwie kolumny!). Napisany przez Państwa kod powinien wyświetlać tylko 10 krajów z najwiekszą wartościa w kolumnie Różnica
posortowanych malejąco.