Motore di ricerca: funzionamenti alla base

Motore di ricerca: funzionamenti alla base

Cercando di capire senza entrare troppo nello specifico e nel tecnico i principali funzionamenti che stanno alla base dei nostri motori di ricerca.
Un motore di ricerca è composto da diversi elementi ma i pilastri su cui si basa sono cinque

componenti motore ricerca

  • Scheduler: la sua funzione è quella di pianificare quando i crawler (robot che prelevano contenuto dalle pagine internet) dovranno prendere in carico il download di una risorsa presente nell’URL che gli è stato affidato

  • Spider (detto crawler o robot): costruisce il Corpus (una raccolta di documenti) collezionando i dati in modo ricorsivo (per ogni url noto analizza gli url presenti in esso). Il lavoro di questo componente è quello di scandire un elenco di pagine web e raccogliere informazioni e memorizzarle nelle repository.

  • Indexer: processa i dati generati dagli Spider generando indici e metadati che facilitano la ricerca. L’indexer svolge diverse funzioni tra i quali la catagorizzazione delle informazioni sui siti web che poi vengono interpretati attraverso algoritmi

  • Parser: estrae la risorsa memorizzata nel repository e ne legge i contenuti, suddividendoli in base alla tipologia. Se la risorsa contiene link ipertestuali questi vengono aggiunti al database e memorizzati nel link graph. In questo trasferimento i dati dell’indice vengono memorizzati insieme ad altri dati come: lingua,genere,tasso di aggiornamento …

  • Query processor: definito anche Search engine software, accetta richieste e fornisce risposte

Architettura nei motori di ricerca moderni

L’architettura dei motori di ricerca moderni è in continua espansione per cercare di venire incontro alle nuove richieste degli utenti.
Il motore di ricerca viene ritenuto imparziale tuttavia, come google, i contenuti ospitati da aziende di proprietà del motore di ricerca possono avere un bonus nel posizionamento, come ad esempio la piattaforma blogger (dal 2003) oppure possono essere generati pagando una cifra alla stessa azienda.
Per aumentare i ricavi infatti l’azienda ha due possibilià: aumentare il numero e la qualità dei clic sui propri annunci pubblicitari o ridurre il costo del motore di ricerca. Possiamo per questo renderci conto di come sia importante per un sito web essere “economico” nei confronti di Google, per questo un sito “anziano” magari di qualche anno sarà visto più “leggero” a differenza di un sito pubblicato in questo momento che dovrà essere scovato.

Articoli Correlati