Jak działają wyszukiwarki internetowe?

Wyszukiwarki internetowe

Jak działają wyszukiwarki internetowe?

Google, Yahoo, Baidu – to tylko kilka przykładów wyszukiwarek internetowych, które każdego dnia pomagają znaleźć informację tysiącom internautów z całego świata. Chociaż jednak każdy z nas korzysta z nich praktycznie codziennie, mało kto potrafi powiedzieć jak dokładnie działają wyszukiwarki. Bo wpisanie danego hasła w pole wyszukiwania to tylko przysłowiowy wierzchołek góry lodowej.

Wyszukiwarka internetowa to nic innego jak jak program komputerowy, którego zadaniem jest wskazanie najtrafniejszych wyników dla danego zapytania. Biorąc pod uwagę, że w internecie mamy dzisiaj miliardy stron (a każdego dnia powstają tysiące nowych), program ten musi być niesamowicie rozbudowany. Mimo tego jego schemat jest stosunkowo prosty i opiera się na trzech głównych elementach.

Po pierwsze: Robot indeksujący

Wszystko zaczyna się od robotów wyszukiwarek, zwanych „Pająkami”, które nieustannie przeczesują internet w poszukiwaniu nowych treści. Pająki poruszają się po linkach (zewnętrznych i wewnętrznych), odwiedzając zarówno nowe jak i wieloletnie witryny. Przy okazji każdej wizyty roboty „czytają” stronę, analizując zarówno jej treść jak i kod HTML. Proces ten nazywany jest „indeksacją”.  Niezaindeksowana strona (taka, na którą Pająk nigdy nie dotarł) nie może pojawić się w wynikach wyszukiwania.

Po drugie: Baza danych i Indeks

Skacząc ze strony na stronę, roboty indeksujące tworzą gigantyczną bazę danych – bazę stron internetowych z całego świata. Baza ta ciągle się zmienia, wraz z nowymi stronami znalezionymi przez robota.

Równocześnie aktualizowany jest indeks. Indeks wyszukiwarki to nic innego jak spis wszystkich słów kluczowych z odnośnikami do stron, na których te słowa występują. Przypomina on nieco indeksy znajdujące się w książkach, tyle, że zamiast numeru strony mamy tutaj odnośnik do konkretnego miejsca w internecie.

Po trzecie: Algorytm oceniający

Kiedy wpisujemy w pole wyszukiwarki konkretne hasło, wyszukiwarka „wie” zatem, na jakich stronach się ono znajduje – ma to zapisane w swoim indeksie. Skąd jednak ma wiedzieć, która ze stron będzie najtrafniejszym wynikiem dla danej frazy?

Tutaj w grę wchodzi algorytm oceniający, będący niewątpliwie najciekawszym i najbardziej tajemniczym elementem każdej wyszukiwarki. Algorytm ten jest unikalny dla każdej wyszukiwarki, zaś jego zadaniem jest ocena poszczególnych stron pod względem trafności odpowiedzi na dane zapytanie. Ocena ta jest wykonywana na podstawie około 200 czynników, które po dziś dzień pozostają tajemnicą wyszukiwarek i może się różnić w zależności od wyszukiwarki.

Na podstawie ocen tych stron, które są powiązane z szukanym słowem w indeksie, powstaje ranking wyszukiwarki. Ranking ten jest następnie wyświetlany jako wyniki wyszukiwania, czyli zbiór linków do najlepszych – według danej wyszukiwarki – stron, na których powinniśmy znaleźć dokładnie to czego szukamy.

Reply