Skip to content

Naiwne wyszukiwanie wzorca w tekście

Problem znalezienia jednego tekstu w drugim to problem, z którym mamy do czynienia praktycznie na co dzień, być może nawet nie zdając sobie z tego sprawy. Gdy jesteśmy na jakiejś stronie internetowej, albo mamy otwarty dokument tekstowy i wciskamy znany skrót CTRL+F, to wtedy właśnie wykonujemy przeszukiwanie tekstu w celu znalezienia wystąpień jakiegoś zadanego ciągu znaków.

Jak niemalże każdy problem (informatyczny), także ten możne zostać rozwiązany w sposób naiwny i takim właśnie rozwiązaniem początkowo się zajmiemy.

Problem wygląda następująco: dostajemy dwa teksty, nazwijmy je tekst oraz wzorzec, a naszym (algorytmu) zadaniem jest sprawdzenie, czy wzorzec zawiera się w tekście.

Specification

Input:

  • \(n\) - długość tekstu, \(n\in\mathbb{N}, n\geq1\)
  • \(tekst[1..n]\) - ciąg znaków o długości \(n\), numerowanych od jedynki
  • \(m\) - długość wzorca, \(m\in\mathbb{N}, 1\leq m\leq n\)
  • \(wzorzec[1..m]\) - ciąg znaków o długości \(m\), numerowanych od jedynki

Output:

  • Indeks pierwszego wystąpienia wzorca w tekście, lub \(-1\) jeżeli wzorzec nie występuje w tekście

Example 1

Input

tekst := "alamakota"
wzorzec := "kot"

Output: \(6\).

Example 2

Input

tekst := "alamakota"
wzorzec := "koty"

Output: \(-1\).

Solution

Pomocnicza funkcja TestujWzorzecsprawdza, czy wzorzec znajduje się w tekście pod indeksem i.

Pseudocode

funkcja TestujWzorzec(i, n, tekst, m, wzorzec)
    1. Dla j := 1 do m, wykonuj:
        2. Jeżeli tekst[i + j - 1] != wzorzec[j], to:
            3. Zwróć FALSE

    4. Zwróć TRUE
funkcja SzukajWzorca(n, tekst, m, wzorzec)
    1. Dla i := 1 do n - m, wykonuj:
        2. Jeżeli TestujWzorzec(i, n, tekst, m, wzorzec), to:
            3. Zwróć i

    4. Zwróć -1

Block diagram

%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
    START(["TestujWzorzec(i, n, tekst, m, wzorzec)"]) --> K0[j := 1]
    K0 --> K1{j <= m}
    K1 -- TRUE --> K2{"tekst[i + j - 1] != wzorzec[j]"}
    K2 -- TRUE --> K3[/Zwróć FALSE/]
    K2 -- FALSE --> K1i[j := j + 1]
    K1i --> K1
    K1 -- FALSE --> K4[/Zwróć TRUE/]
    K4 --> STOP([STOP])
    K3 --> STOP
%%{init: {"flowchart": {"curve": "linear"}, "theme": "neutral"} }%%
flowchart TD
    START(["SzukajWzorca(n, tekst, m, wzorzec)"]) --> K0[i := 1]
    K0 --> K1{i <= n - m}
    K1 -- TRUE --> K2{"TestujWzorzec(i, n, tekst, m, wzorzec)"}
    K2 -- TRUE --> K3[/Zwróć i/]
    K2 -- FALSE --> K1i[i := i + 1]
    K1i --> K1
    K1 -- FALSE --> K4[/Zwróć -1/]
    K4 --> STOP([STOP])
    K3 --> STOP

Complexity

\(O(n*m)\to O(n^2)\) - kwadratowa

Implementation

C++

Python