Iskanje podatkov v globalnem omrežju


Spletni iskalniki

iskalnik je programska oprema, ki uporabnikom pomaga najti informacije, shranjene v računalniškem sistemu. Obstaja več vrst iskalnikov, ki so zasnovani za pridobivanje dokumentov, shranjenih v svetovnem spletu, znotraj korporacijskega ali lastniškega omrežja ali v osebnem računalniku. Rezultati iskanja so navadno predstavljeni v obliki seznama in se običajno imenujejo zadetki. Iskalniki pomagajo zmanjšati čas, potreben za iskanje informacij in količino informacij, ki jih moramo pregledati.


Najbolj znana oblika iskalnikov so spletni iskalniki, ki iščejo informacije na svetovnem spletu.

Rezultati iskanja so na splošno predstavljeni v obliki seznama rezultatov in predstavljeni v obliki spletnih strani. Rezultati  so lahko mešanica spletnih strani, slik, video posnetkov, infografik, člankov, raziskovalnih člankov in drugih vrst datotek. Nekateri iskalniki vsebujejo tudi podatke, ki so na voljo v podatkovnih bazah ali odprtih imenikih. Za razliko od spletnih imenikov, ki jih vzdržujejo le človeški urejevalniki, iskalniki vzdržujejo tudi informacije v realnem času z uporabo algoritma na spletnem pajku. Internetna vsebina, ki je ni mogoče iskati prek spletnega iskalnika, je na splošno opisana kot globoko splet.

Obstaja ogromno iskalnikov spletnih strani. Spisek vseh iskalcev najdemo na http://www.searchenginecolossus.com/. Vsi pa uporabljajo podobne prijeme, da si napolnijo svojo bazo strani, po katerih iščemo:

Najbolj popularni iskalniki so trenutno: Google, Bing, Baidu, Yahoo! Yandex, Ask.com, DuckDuckGo


Kako delujejo iskalniki

Spletni iskalniki uporabljajo robotske aplikacije, ki samodejno preiskujejo internet, obiskujejo spletne strani in shranjujejo podatke o njihovi vsebini, ki se nato prevedejo v ogromen indeks.

Program imenovan pajek je avtomatski program, ki raziskuje omrežje Internet in dodaja oz. odvzema s spletnih strani ustrezne informacije. Indeksni program organizira in uredi vse dobljene informacije po različnih ključih. Podatkovna baza je zbirka vseh informacij, ki jih lahko dobimo od iskalnika in je potrebna za njegovo delovanje, to je dajanje iskalnih rezultatov. Vmesnik iskalnika  je običajno spletno okno, preko katerega uporabnik zahteva iskani niz ali besedilo.

Vsak iskalnik uporablja lastni algoritem za ustvarjanje svojih indeksov, tako da se za vsako poizvedbo vrnejo samo pomembni rezultati. Da bi našli ustrezne spletne strani, iskalniki vsakemu dokumentu dajo uvrstitev, tj. oceno pomembnosti. Rezultati ustreznosti odražajo, kolikokrat se iskalni izraz pojavi, če se pojavi v naslovu, če se pojavi na začetku dokumenta in če so vsi iskalni izrazi blizu drug drugemu. Vendar pa je običajno kratka poletje bolj uporabna kot razvrstitev.


Kako definiramo iskanje

To so potrebni koraki za pridobivanje informacij iz iskalnika:

  1. V iskalnik vtipkamo nekaj ključnih besed
  2. Programska oprema iskalnikov hitro razvrsti milijone strani v svoji zbirki podatkov, da bi našla ujemanje s to poizvedbo;
  3. Rezultati so razvrščeni po pomembnosti.

Iskanje več besed zoži iskanje, medtem ko iskanje manj besed razširi iskanje. Mnogi iskalniki uporabljajo orodja, kot sta AND, OR in NOT za pomoč. Nekateri iskalniki imajo prefinjene načine za zmanjšanje iskanja, da bi povečali možnosti, da uporabnik najde tisto, kar si želijo: lahko se osredotočijo na določeno vrsto spletnega mesta, združijo indeks v teme in teme ali ponudijo uporabnikom predloge po začetnem iskanju.


Kako izboljšati rezultate iskanja

Spodnja slika kaže zaslon za napredno iskanje (advanced search) v iskalniku Google.




Namizni iskalniki


Ta orodja so namenjena iskanju informacij na uporabnikovem računalniku, vključno z zgodovino spletnega brskalnika, arhivi e-pošte, dokumentov z besedilom, zvočnimi datotekami, slikami in videi. Na voljo so različni programi za iskanje po namizju. Večina programov za iskanje po namizju so samostojne aplikacije. Izdelki za iskanje po namizju so nadomestki za programsko opremo za iskanje, ki je vključena v operacijski sistem, kar uporabnikom pomaga pri pregledovanju datotek namizja, e-poštnih sporočil, prilog in še več. Za uspešno in hitro izvedeno iskano operacijo je treba najprej ustvariti indeks ali kazalo podatkov. Tako namesto vedno ponovnega iskanja po datotekah iščemo znotraj indeksa, ki je nekakšna baza podatkov o datotekah, njihovi vsebini ali njihovih meta podatkih. Indeksiranje je torej potrebno opraviti, preden želimo začeti s iskanjem, in ga je potrebno redno ponavljati. (npr. ob zagonu računalnika, ob prijavi ali tudi večkrat dnevno).

Trenutno so najbolj razširjeni namizni iskalniki, ki se razen v imenu proizvajalca in zunanjem izgledu razlikujejo predvsem v podpori različnih zapisov datotek, znotraj katerih so sposobni iskati.