Wyszukiwanie liniowe¶
Wyobraźmy sobie półkę z książkami. Książki na półce ułożone są w losowej kolejności, nie zachowując żadnego sensownego porządku. Innymi słowy: są nieuporządkowane. Naszym zadaniem jest znaleźć jedną konkretną książkę. Znamy jej tytuł, znamy autora. Jak się do tego zabrać?
Jeżeli nie chcemy poświęcać na to zadanie więcej czasu niż to konieczne i porządkować książek przed przystąpieniem do przeszukiwania, to rozwiązanie jest proste. Musimy sprawdzić każdą kolejną książkę. Możemy to robić w sposób losowy i liczyć na to, że nam się poszczęści, albo lepiej, w sposób uporządkowany. Sprawdzamy więc książki jedna po drugiej, od lewej do prawej (lub od prawej do lewej, jak kto woli) aż natrafimy na tą poszukiwaną. I to jest właśnie wyszukiwanie liniowe.
Oczywiście na komputerze nie będziemy przeszukiwać książek (chociaż czasem i to robimy), tylko zajmiemy się przeszukiwaniem tablicy elementów w poszukiwaniu konkretnej, zadanej wartości.
Istnieje oczywiście kilka wersji tego problemu. Zacznijmy od pierwszej z nich, być może najprostszej.
Istnienie elementu¶
Jedną z najprostszych wersji problemu wyszukiwania jest sprawdzenie, czy dany element istnieje w zbiorze. Wyobraźmy sobie, że jesteśmy w sklepie i pytamy ekspedienta, czy jest mleko. Ekspedient przegląda dostępne produkty i odpowiada: tak lub nie. W takim przypadku interesuje nas tylko to, czy mleko w ogóle jest aktualnie w sprzedaży, nie to ile sztuk mleka jest dostępnych, czy też gdzie się ten produkt znajduje.
Naszym celem będzie więc sprawdzenie, czy w tablicy znajduje się poszukiwana wartość. Zacznijmy od tanecznego wyszukiwania, formalnej specyfikacji i kilku przykładów.
Taneczne wyszukiwanie¶
Specification¶
Input¶
- \(n\) — liczba naturalna, liczba elementów w tablicy
- \(A[1..n]\) — tablica n wartości całkowitych
- \(k\) — liczba całkowita, szukana wartość
Output¶
- Wartość TRUE, jeżeli wartość \(k\) znajduje się w tablicy \(A\), lub FALSE w przeciwnym przypadku
Example 1¶
Input¶
Output: TRUE
Info
Wyjaśnienie
Poszukiwana wartość w tablicy to \(7\). Jak widać, ta wartość znajduje się w tablicy, stąd też wynik to TRUE.
Example 2¶
Input¶
Output: FALSE
Info
Wyjaśnienie
Poszukujemy wartości \(3\), która nie występuje w tablicy. Dlatego wynik to FALSE.
Solution¶
Znamy już problem, teraz pytanie brzmi, jak go rozwiązać? Jaki algorytm skonstruujemy? Wiemy, że chodzi o algorytm przeszukiwania liniowego, czyli sprawdzania elementów jeden po drugim. I dokładnie to musimy zrobić. Będziemy przeglądać elementy od pierwszego do ostatniego. Każdy kolejny element z tablicy będziemy porównywać z poszukiwaną wartością.
Teraz pytanie brzmi: co zrobimy, gdy natrafimy na poszukiwany element? Odpowiedź jest stosunkowo prosta. Gdy stwierdzimy, że poszukiwany element znajduje się w tablicy (czyli gdy go znajdziemy), to należy zwrócić stosowny wynik, czyli wartość TRUE. I co robimy dalej? Cóż, w tym momencie możemy już zakończyć obliczenia, ponieważ stwierdziliśmy istnienie elementu w tablicy. Tak więc otrzepujemy ręce i kończymy, dobra robota!
Pozostaje nam jeszcze jednak do rozważenia sytuacja, w której poszukiwany element nie występuje w tablicy. Co zrobimy w takim przypadku? Oczywiście powinniśmy zwrócić wartość FALSE, ale jak stwierdzić, że elementu nie ma w tablicy? Zastanówmy się nad tym chwilę. Gdy znajdziemy element w tablicy to zwracamy wartość TRUE i kończymy działanie. Gdy nie znajdziemy elementu w tablicy, to nie zwrócimy wartości TRUE i po prostu sprawdzimy wszystkie elementy tablicy.
W takim razie, gdy sprawdzimy już wszystkie elementy tablicy i nadal będziemy wykonywać kolejne operacje (ponieważ nie zakończyliśmy wcześniej działania) będzie to oznaczało, że nie znaleźliśmy elementu w tablicy! W takim razie zwracamy FALSE i kończymy działanie.
Warning
Zwróć uwagę na to, że wartość FALSE należy zwrócić po sprawdzeniu wszystkich elementów tablicy, czyli po wyjściu z pętli.
Pseudocode¶
funkcja SzukajLiniowo(n, A, k)
1. Od i := 1 do n, wykonuj:
2. Jeżeli k = A[i], to:
3. Zwróc TRUE
4. Zwróć FALSE
Block diagram¶
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
START(["SzukajLiniowo(n, A, k)"]) --> B[i := 1]
B --> C{i <= n}
C -- FALSE --> D[/Zwróc FALSE/]
C -- TRUE --> E{"k = A[i]"}
E -- TRUE --> F[/Zwróc TRUE/]
E -- FALSE --> G[i := i + 1]
G --> C
D --> STOP([STOP])
F --> STOP
Complexity¶
Głównym elementem algorytmu jest pętla przechodząca po kolei przez wszystkie wartości w tablicy. Ta pętla wykonuje dokładnie \(n\) powtórzeń. Stąd też otrzymujemy złożoność liniową.
\(O(n)\) — liniowa
Pozycja elementu¶
Czasami nie wystarczy nam informacja, że element gdzieś się znajduje. Czasem musimy dokładnie wiedzieć, w którym miejscu jest. Innymi słowy, chcemy poznać położenie, czy też indeks w tablicy, pod którym znajduje się poszukiwana wartość (jeżeli oczywiście w ogóle znajduje się w tablicy). Zacznijmy od formalnej specyfikacji i kilku przykładów.
Warning
Szukana wartość może występować w tablicy wielokrotnie. Nas jednak na początek interesuje jej dowolne położenie.
Specification¶
Input¶
- \(n\) — liczba naturalna, liczba elementów w tablicy
- \(A[1..n]\) — tablica n wartości całkowitych
- \(k\) — liczba całkowita, szukana wartość
Output¶
- Indeks dowolnego wystąpienia wartości \(k\) w tablicy \(A\), lub \(-1\) jeżeli tej wartości nie ma w tablicy
Example 1¶
Input¶
Output: \(3\)
Info
Wyjaśnienie
Poszukiwana wartość w tablicy to \(7\). Jak widać, ta wartość znajduje się na trzecim miejscu w tablicy, stąd też wynik wynosi \(3\).
Example 2¶
Input¶
Output: \(-1\)
Info
Wyjaśnienie
Poszukujemy wartości \(3\), która nie występuje w tablicy. Dlatego wynik to \(-1\).
Solution¶
Do skonstruowania rozwiązania tego problemu skorzystamy z poprzedniego rozwiązania. Zastanówmy się, jakie są różnice pomiędzy tymi dwoma problemami i co musimy zmienić.
Różnicę tak naprawdę stanowią jedynie wartości, jakie mamy zwrócić w wyniku. Poprzednio zwracaliśmy TRUE, gdy element istniał w tablicy. Teraz mamy zwrócić jego indeks. Oznacza to, że musimy zmienić instrukcję, w której zwracamy wynik TRUE (numer 3). Powinniśmy w tym miejscu zwrócić indeks elementu, jednak skąd wziąć tę wartość? Przyjrzyjmy się poprzedzającej instrukcji warunkowej. W niej sprawdzamy, czy szukana wartość występuje pod aktualnie sprawdzanym indeksem w tablicy. A jaki to jest indeks? Ten indeks określany jest przez zmienną, która stanowi licznik naszej pętli, czyli przez zmienną \(i\). W takim razie zamiast TRUE zwracamy wartość zmiennej \(i\). Gotowe!
Teraz skupmy się na drugim możliwym wyniku. Przedtem zwracaliśmy FALSE. Co teraz powinniśmy zwrócić, gdy element nie występuje w tablicy? Wystarczy spojrzeć na specyfikację. Zastępujemy FALSE wartością \(-1\) i kończymy działanie.
Pseudocode¶
funkcja SzukajLiniowo(n, A, k)
1. Od i := 1 do n, wykonuj:
2. Jeżeli k = A[i], to:
3. Zwróć i
4. Zwróć -1
Block diagram¶
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
START(["SzukajLiniowo(n, A, k)"]) --> B[i := 1]
B --> C{i <= n}
C -- FALSE --> D[/Zwróć -1/]
C -- TRUE --> E{"k = A[i]"}
E -- TRUE --> F[/Zwróć i/]
E -- FALSE --> G[i := i + 1]
G --> C
D --> STOP([STOP])
F --> STOP
Complexity¶
\(O(n)\) — liniowa
Wszystkie pozycje elementu¶
Wiemy już jak sprawdzić, czy wartość występuje w tablicy, a także jak ją w tej tablicy namierzyć. Co jednak w przypadku, gdy chcemy poznać wszystkie wystąpienia poszukiwanego elementu w tablicy? Teraz zajmiemy się takim właśnie problemem.
Specification¶
Input¶
- \(n\) — liczba naturalna, liczba elementów w tablicy
- \(A[1..n]\) — tablica n wartości całkowitych
- \(k\) — liczba całkowita, szukana wartość
Output¶
- Lista wszystkich indeksów, pod którymi znajduje się wartość \(k\) w tablicy \(A\)
Example 1¶
Input¶
Output: \([1, 3, 5]\)
Info
Wyjaśnienie
Poszukiwana wartość w tablicy to \(7\). Jak widać, ta wartość znajduje się na pierwszym, trzecim oraz ostatnim (piątym) miejscu w tablicy.
Example 2¶
Input:¶
Output: \([\ ]\)
Info
Wyjaśnienie
Poszukiwana wartość w tablicy to \(3\). Jak widać, ta wartość nie występuje w tablicy, stąd też wynik jest pusty, ponieważ lista indeksów jest pusta.
Solution¶
W ogólności zwrócenie listy, czy też tablicy jako wynik działania bywa problematyczne, w zależności od języka programowania. Dlatego skupimy się na czymś podobnym, tzn. wypiszemy wszystkie wyniki na ekranie.
Zastanówmy się, jak zmodyfikować poprzednie rozwiązanie. Jakie są różnice pomiędzy tą wersją problemu, a poprzednią, w której jako wynik zwracaliśmy indeks tylko jednego, pierwszego wystąpienia wartości w tablicy.
Po pierwsze, teraz chcemy wypisać wszystkie indeksy, pod którymi pojawia się szukana wartość. W takim razie nie możemy kończyć działania po znalezieniu pierwszego wystąpienia, musimy iść dalej. Mówiąc dokładniej, musimy przejrzeć całą tablicę. Dokonajmy więc dwóch zmian w instrukcji 3: zamiast zwróć zrobimy wypisz i usuniemy polecenie zakończ.
Potrzebujemy dokonać jeszcze jednej zmiany. Zauważmy, że teraz nie musimy się zastanawiać nad tym, co zrobić w przypadku, gdy poszukiwany element nie występuje w tablicy. W takim przypadku po prostu nic nie wypiszemy na ekran. Dlatego usuwamy ostatnią instrukcję (numer 4), w której zwracamy wynik -1.
Pseudocode¶
Block diagram¶
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
START(["SzukajLiniowo(n, A, k)"]) --> B[i := 1]
B --> C{i <= n}
C -- FALSE ---> STOP([STOP])
C -- TRUE --> E{"k = A[i]"}
E -- TRUE --> F[/Wypisz i/]
E -- FALSE --> G[i := i + 1]
F --> G
G --> C
Complexity¶
\(O(n)\) — liniowa