Naiwne wyszukiwanie wzorca w tekście¶
Problem znalezienia jednego tekstu w drugim to problem, z którym mamy do czynienia praktycznie na co dzień, być może nawet nie zdając sobie z tego sprawy. Gdy jesteśmy na jakiejś stronie internetowej, albo mamy otwarty dokument tekstowy i wciskamy znany skrót CTRL+F, to wtedy właśnie wykonujemy przeszukiwanie tekstu w celu znalezienia wystąpień jakiegoś zadanego ciągu znaków.
Jak niemalże każdy problem (informatyczny), także ten możne zostać rozwiązany w sposób naiwny i takim właśnie rozwiązaniem początkowo się zajmiemy.
Problem wygląda następująco: dostajemy dwa teksty, nazwijmy je tekst oraz wzorzec, a naszym (algorytmu) zadaniem jest sprawdzenie, czy wzorzec zawiera się w tekście.
Specification¶
Input:¶
- \(n\) - długość tekstu, \(n\in\mathbb{N}, n\geq1\)
- \(tekst[1..n]\) - ciąg znaków o długości \(n\), numerowanych od jedynki
- \(m\) - długość wzorca, \(m\in\mathbb{N}, 1\leq m\leq n\)
- \(wzorzec[1..m]\) - ciąg znaków o długości \(m\), numerowanych od jedynki
Output:¶
- Indeks pierwszego wystąpienia wzorca w tekście, lub \(-1\) jeżeli wzorzec nie występuje w tekście
Example 1¶
Input¶
Output: \(6\).
Example 2¶
Input¶
Output: \(-1\).
Solution¶
Pomocnicza funkcja TestujWzorzec
sprawdza, czy wzorzec znajduje się w tekście pod indeksem i
.
Pseudocode¶
funkcja TestujWzorzec(i, n, tekst, m, wzorzec)
1. Dla j := 1 do m, wykonuj:
2. Jeżeli tekst[i + j - 1] != wzorzec[j], to:
3. Zwróć FALSE
4. Zwróć TRUE
funkcja SzukajWzorca(n, tekst, m, wzorzec)
1. Dla i := 1 do n - m, wykonuj:
2. Jeżeli TestujWzorzec(i, n, tekst, m, wzorzec), to:
3. Zwróć i
4. Zwróć -1
Block diagram¶
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
START(["TestujWzorzec(i, n, tekst, m, wzorzec)"]) --> K0[j := 1]
K0 --> K1{j <= m}
K1 -- TRUE --> K2{"tekst[i + j - 1] != wzorzec[j]"}
K2 -- TRUE --> K3[/Zwróć FALSE/]
K2 -- FALSE --> K1i[j := j + 1]
K1i --> K1
K1 -- FALSE --> K4[/Zwróć TRUE/]
K4 --> STOP([STOP])
K3 --> STOP
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
START(["SzukajWzorca(n, tekst, m, wzorzec)"]) --> K0[i := 1]
K0 --> K1{i <= n - m}
K1 -- TRUE --> K2{"TestujWzorzec(i, n, tekst, m, wzorzec)"}
K2 -- TRUE --> K3[/Zwróć i/]
K2 -- FALSE --> K1i[i := i + 1]
K1i --> K1
K1 -- FALSE --> K4[/Zwróć -1/]
K4 --> STOP([STOP])
K3 --> STOP
Complexity¶
\(O(n*m)\to O(n^2)\) - kwadratowa