Bilaketa Teknikak eta Bilatzaileak: Optimizazio Gida
Enviado por Programa Chuletas y clasificado en Psicología y Sociología
Escrito el en vasco con un tamaño de 5,6 KB
Bilaketak: motak eta erabilera
1. Bilaketa sinpleak
Irizpide bakarra betetzen duten agerraldiak dira. Ez da jasotzen hitza deklinaturik, ezta izenondoak edo horien deklinabideak ere. Adibidez: "ekologia", ez "ekologiko" ezta "ekologista" ere.
2. Bilaketa zabalak
Terminoari erroa utzi eta erro hori duten hitz guztiak berreskuratzeko erabiltzen da. Adibidez: "nekaza*" -> "nekazal", "nekazalgo", "nekazari", "nekazaritza"...; "turis*" -> "turismo", "turista", "turistiko", "nekazalturismo"... Edo maskaratzaileak erabiltzen dira, karaktere bat edo gehiago ezkutatzeko, eta, beraz, karaktere hori omitituz, bilaketa zabalagoa izan dadin. Adibidez: "de?a" bilaketak emango du: "deba", "deva", "dema"...
3. Gertutasun irizpideak
Hauek determinatzen dute bilaketa bat egiterakoan sartzen diren terminoen arteko gertutasuna; izan litezke:
- Elkarren ondoan (adj): hitzak elkarren ondoan eta ordena berdinean joan daitezen. Adibidez: "gizona bere bakardadean".
- Distantzia jakin batekin: hau da, sartutako terminoen artean hitz kopuru jakin bat egon dadila soilik. Adibidez: "prentsa (w/5) argazkilaritza" terminoen artean, 1, 2 eta hiru hitz.
- Esaldi edo paragrafo berean egon daitezela sartutako terminoak. Adibidez: "prentsa (near) argazkilaritza".
4. Kokapen zehatzaren irizpideak
Eskatutakoak dokumentuaren eremu jakin batean agertu behar du. Adibidez: "zinemaren historia" dokumentu baten tituluan ager dadila. Konparazio horiek egiteko badaude ikurrak: <, >, =. Adibidez: ">2005/01/12 <2005/06/01" data eremua erakusten du horrek: 2005eko urtarrilaren 12tik 2005eko ekainaren 1era, alegia.
5. Eragile boolearrak
ETA (AND), EDO (OR), EZ (NOT). Sartutako hitzen arteko erlazioa ezartzen du. Hitz guztiek atera behar, bata edo bestea, hitz bat ez atera behar... Adibidez: "lege ETA telebista", "lege EDO araudi", "diseinu NOT web".
6. Bilaketak aurrez hautatutako multzo batean
Behin bilaketa egin ondoren, jasotako erantzunen artean beste hautaketa bat egiteko aukera ematen du sistemak.
7. Atzera-elikadura
Sistemari dokumentu bat erakutsi eta horren modukoak aurkitzeko eskatzen zaio.
8. Hiztegi kontrolatua
Bilaketa hiztegi kontrolatu baten bidez egiten da (adibidez, UNESCOren datu-basean, bertako Thesaurusa erabiliz).
9. Agerraldien ordena
Irizpide ezberdinen arabera izan daiteke, eta erabiltzaileak badu aukera bere irizpideen arabera ordenatzeko; hala ere, bi dira irizpide nagusiak:
- Nabarmentasuna: terminoa tituluan, hasieran, beste termino batzuekin ateratzen den arabera.
- Ikusgarritasuna: lehenengo agertuko dira esteka asko jasotzen dituzten webguneak (adibidez, Google-n PageRank sistema).
Bilatzaileak (Google, adibidez)
Bilatzailea Internet automatikoki aztertzen duen sistema da. Webguneen helbideak batzen ditu datu-base batean, eta gero datuak bilatzeko aukera ematen du datu-basea kontsultatuz. Robotek noizbehinka miatuko dute sarea, ez da uneoro berritzen. Informazioa eskatzen dugunean, lehenengo bere katxean (memorian) begiratuko du gordetako kopia, horrela erantzuna oso azkarra izaten ahalbidetuz.
Funtzionamendua:
- Robotak sarea arakatzen du.
- Programa indexatzailea lortutako informazioa aztertu eta deszifratzen du.
- Informazioa datu-base erraldoi batean sartzen da.
- Galderak egiteko sistema (formularioa).
- Emaitzen zerrenda eta honen hurrenkera, algoritmo batek erabakita.
Hiru bilatzaile mota daude: orokorra, espezifikoa eta metabilatzailea.
- Orokorrak: nabigatzeko eta informazioa bilatzeko eguneroko tresnak dira. % 15 bakarrik ahal izango dugu eskuratu (Internet ikusezina). Gaur egun erabilienak: Google, Bing eta Ask.com, besteak beste.
- Espezifikoak: geografikoki mugatuak, enpresarako, osasuna, albisteak, blogak, pertsonak, mapak, galdera-erantzunak, prezioak, hezkuntza…
- Metabilatzaileak: ez daukate datu-base propiorik, bilatzaile anitzetara bideratzen dituzte bilaketak. Adibidez: Metacrawler, Ixquick, Clusty, Excite, HotBot…
1997an sortu zuten Sergey Brinek eta Larry Pagek. Bere arrakasta sinpletasunean, informazio kopuruan (handiena) eta emaitzen ordenamenduan datza. PageRank algoritmoaren arabera, esteka asko jasotzen dituzten orriak lehen postuetan egongo dira, baina baita berritzearen arabera ere. Gainera, azken urtean, norberaren lehentasunen arabera sailkatzen dira. Googlen ardatza bilatzailea bada ere, beste zerbitzu eta tresna arrakastatsu batzuk ere sortu ditu. URL bat baino gehiago dago. Adibidez: www.google.com, www.google.es, www.google.com.mx (Mexiko)… Bilaketa planifikatu egin behar da, bilatu aurretik pentsatu egin behar dugu zer nahi dugun: testuak, irudiak, iritziak, albisteak, gidaliburuak… Zein hizkuntzatan lortu nahi dugun edukia eta hitz gakoak aukeratu: bat, batzuk, zehaztu…
Bilaketa bat egiterakoan berdin da letra larria edota xehea idaztea, tildeak eta dieresiak ere ez ditu kontuan hartzen. Bilaketak zehazteko hainbat sinbolo ditugu eta bilaketa aurreratua pantaila.
- Esaldia edota hitzen ordena zehatza: " "
- Boolearrak: ETA (ezer ez), EDO (OR), EZ (-)
- () ETA eta EDO konbinatzeko
- Gehi ikurra +: de, la, con, por… eta halakoak bilatzeko.
- Tituluan: intitle:
- Helbidean: inurl:
- Webgune zehatz batean: site:
- Formatu zehatza: filetype: