Przejdź do treści

Książki

W pliku ksiazki.txt znajduje się zestawienie najpopularniejszych książek, pod względem liczby sprzedanych kopii. Każda linia zawiera następujące informacje:

  • tytuł książki,
  • autor książki,
  • język oryginału,
  • rok pierwszej publikacji,
  • szacunkowa liczba sprzedanych sztuk w milionach,
  • gatunek literacki.

Dane oddzielone są tabulacjami. Pierwszy wiersz zawiera nagłówki kolumn.

ksiazki.txt

Źródło danych: https://www.kaggle.com/datasets/drahulsingh/best-selling-books

Zadanie 1

Wypisz wszystkie nazwiska autorów występujących w zestawieniu. Następnie oblicz, ile książek opublikował autor o takim nazwisku, oraz ile łącznie sztuk tych książek (w milionach) zostało sprzedanych.

Zadanie 2

Dla każdego autora policz, ile imion on posiada. Imiona są zawsze wymienione przed nazwiskiem i zaczynają się od wielkiej litery (w pełnej lub skróconej formie), a nazwisko jest zawsze ostatnim wyrazem.

Zadanie 3

Dla każdej litery alfabetu oblicz, ile jest książek, których tytuł zaczyna się od tej litery. Uwaga: w tytułach książek zignoruj "The". Np. jeżeli tytuł książki to "The Help" przyjmujemy, że pierwsza litera tytułu to "H".

Zadanie 4

Oblicz, ile jest książek, które: - nie mają zdefiniowanego gatunku, - mają dokładnie jeden gatunek, - mają dwa lub więcej gatunków.

Zadanie 5

Oblicz, ile książek zostało opublikowanych w poszczególnych stuleciach, poczynając od roku 1700.

Zadanie 6

Oblicz, ile jest książek, które w gatunku mają zapis "novel" lub "Novel".

Zadnie 7

Dla każdego autora oblicz, ile jest lat, w których opublikował przynajmniej jedną książkę.

Zadanie 8

Utwórz zestawienie pokazujące procentowy udział każdego języka w liczbie sprzedanych sztuk książek.