|
Autori
|
|
Graziella Anselmi |
|
Sandro Domenico Armenio |
|
Maurizia Caldara |
|
Silvia Fontana |
|
Antonio Gaetano |
|
Maria Ada Molaschi |
|
|
Indici Web per parola, detti anche “motori di ricerca”, “search engine”, “robot”, “spider” o “worm”. Grazie ad appositi programmi raccolgono automaticamente in grandi archivi centinaia di milioni di pagine web e permettono di individuare al loro interno tutte le occorrenze di uno o più termini digitati dal ricercatore in una apposita maschera. I risultati trovati, purtroppo, non sono sempre pertinenti, anche se questi strumenti vengono continuamente perfezionati per consentire interrogazioni e metodi di ordinamento sempre più sofisticati. Il problema consiste nella difficoltà di far individuare automaticamente a un programma, senza l’intervento di catalogatori umani, omonimie, sinonimie e più in generale il contenuto semantico delle pagine Web.
Un tipico motore di ricerca è composto da tre elementi: lo spider, l’indice e l’interfaccia.
Lo spider scandaglia automaticamente internet e raccoglie dati ed il contenuto delle pagine che incontra.
L’indice è il centro del programma: contiene gli algoritmi per la ricerca e l’ordine di presentazione delle pagine.
L’interfaccia è ciò che l’utente “vede”. E’ molto importante perché deve essere semplice ed efficace al tempo stesso.
In genere i motori presentano un’interfaccia per la ricerca semplice ed una per la ricerca avanzata che generalmente utilizzano gli operatori booleani (il termine deriva da George Boole, matematico inglese della prima metà dell’800 che propose di utilizzare la logica binaria).
I più conosciuti ed usati sono AND, OR, NOT; un insieme di parole (stringa) inserite nelle “”, il troncamento *, e NEAR che però è un operatore che pochi motori utilizzano. Le parole legate da NEAR non devono distare nel testo più di un certo intervallo.
Pagine simili. Alcuni motori, fra cui AltaVista e Google, permettono di rintracciare (con una ricerca che viene talvolta definita impropriamente “per concetto” ma che andrebbe chiamata “per somiglianza”) ulteriori pagine Web contenenti una certa percentuale di parole uguali a quelle delle pagine già trovate, nel tentativo di recuperare parte del contenuto semantico sfuggito con la ricerca per parole.
Esistono infine i metamotori che permettono l’interrogazione contemporanea di più indici utilizzando un’unica interfaccia come Ixquick e Metacrawler che consulta InfoSeek, Virgilio, Lycos, NorthernLight, HotBot, AltaVista, Excite, Yahoo, DirectHit.
Fonti:
Istituto Universitario di Architettura – Corrado Petrucco
E.S. Burioni Ricerche bibliografiche
|
1 Comment
[…] Motori […]