Książki¶
W pliku ksiazki.txt znajduje się zestawienie najpopularniejszych książek, pod względem liczby sprzedanych kopii. Każda linia zawiera następujące informacje:
- tytuł książki,
- autor książki,
- język oryginału,
- rok pierwszej publikacji,
- szacunkowa liczba sprzedanych sztuk w milionach,
- gatunek literacki.
Dane oddzielone są tabulacjami. Pierwszy wiersz zawiera nagłówki kolumn.
Źródło danych: https://www.kaggle.com/datasets/drahulsingh/best-selling-books
Zadanie 1¶
Wypisz wszystkie nazwiska autorów występujących w zestawieniu. Następnie oblicz, ile książek opublikował autor o takim nazwisku, oraz ile łącznie sztuk tych książek (w milionach) zostało sprzedanych.
Zadanie 2¶
Dla każdego autora policz, ile imion on posiada. Imiona są zawsze wymienione przed nazwiskiem i zaczynają się od wielkiej litery (w pełnej lub skróconej formie), a nazwisko jest zawsze ostatnim wyrazem.
Zadanie 3¶
Dla każdej litery alfabetu oblicz, ile jest książek, których tytuł zaczyna się od tej litery. Uwaga: w tytułach książek zignoruj "The". Np. jeżeli tytuł książki to "The Help" przyjmujemy, że pierwsza litera tytułu to "H".
Zadanie 4¶
Oblicz, ile jest książek, które: - nie mają zdefiniowanego gatunku, - mają dokładnie jeden gatunek, - mają dwa lub więcej gatunków.
Zadanie 5¶
Oblicz, ile książek zostało opublikowanych w poszczególnych stuleciach, poczynając od roku 1700.
Zadanie 6¶
Oblicz, ile jest książek, które w gatunku mają zapis "novel" lub "Novel".
Zadnie 7¶
Dla każdego autora oblicz, ile jest lat, w których opublikował przynajmniej jedną książkę.
Zadanie 8¶
Utwórz zestawienie pokazujące procentowy udział każdego języka w liczbie sprzedanych sztuk książek.