Adamantio.net

Web

Operatori di ricerca

by on gen.27, 2012, under Google Guide, Parte I: Comporre le richieste, Web

La seguente tabella elenca gli operatori di ricerca che funzionano con ogni servizio di ricerca di Google. Cliccate su un operatore per saltare alla sua descrizione – o, per leggere di tutti gli operatori, scorrete in giù la pagina.

Servizio di ricerca Operatori di ricerca
Ricerca Web allinanchor:, allintext:, allintitle:, allinurl:, cache:,
define:, filetype:, id:inanchor:,info:, intext:,
intitle:, inurl:, link:, phonebook:, related:, site:
Ricerca Immagini allintitle:allinurl:filetype:inurl:intitle:site:
Gruppi allintext:allintitle:author:group:insubject:intext:,
intitle:
Directory allintext:allintitle:allinurl:ext:filetype:intext:,
intitle:inurl:
Notizie allintext:allintitle:allinurl:intext:intitle:inurl:,
location:source:
Ricerca Prodotti allintext:allintitle:

La seguente è una lista alfabetica degli operatori di ricerca. Questo elenco include operatori che non sono ufficialmente supportati da Google e non sono elencati nell’help in linea di Google.

Nota: Google potrebbe cambiare il funzionamento degli operatori non documentati o eliminarli completamente.

Ciascuna voce include tipicamente la sintassi, le possibilità, ed un esempio. Alcuni operatori di ricerca non funzionano come dovrebbero se mettete uno spazio fra il comando con i due punti (:) e la susseguente parola chiave. Se non volete preoccuparvi di controllare quale operatore di ricerca non richiede spazio dopo i due punti, scrivete la parola chiave sempre dietro ai due punti. Molti operatori di ricerca possono apparire ovunque nell’interrogazione. Nei nostri esempi, poniamo l’operatore di ricerca il più a destra possibile. Facciamo in questo modo perchè il form di ricerca avanzata scrive le query in questo modo. Inoltre, questo tipo di convenzione rende più chiaro quale operatore sia associato a quale termine.

allinanchor:
Se cominciate l’interrogazione con allinanchor:, Google restringe i risultati alle pagine contenenti tutti i termini ricercati specificati nell’ anchor text presente nei link delle pagine. Ad esempio, [ allinanchor: best museums sydney ] restituirà solo le pagine in cui l’anchor text sui links delle pagine contiene le parole “best,” “museums,” e “sydney.”L’ anchor text è il testo su una pagina che è collegato ad un altra pagina web o a posti differenti sulla pagina corrente. Quando cliccate su un anchor text, verrete portati nella pagina o posizione sulla pagina in cui il testo è collegato. Quando utilizzate allinanchor: nella vostra richiesta, non includete altri operatori di ricerca. La funzionalità di allinanchor: è anche disponibile mediante la pagina di ricerca avanzata.
allintext:
Se cominciate l’interrogazione con allintext:, Google restringe i risultati alle pagine contenenti tutti i termini ricercati specificati nel testo della pagina. Ad esempio, [ allintext: travel packing list ] restituirà solo le pagine in cui le parole “travel,” “packing,” e “list” appaiono nel testodella pagina. Questa funzionalità può anche essere ottenuta mediante il pannello di ricerca avanzata.
allintitle:
Se cominciate l’interrogazione con allintitle:, Google restringe i risultati alle pagine contenenti tutti i termini ricercati specificati nel titolo. Ad esempio, [ allintitle: detect plagiarism ] restituirà solo le pagine in cui le parole  “detect” e “plagiarism” compaiono nel titolo. Questa funzionalità può anche essere ottenuta mediante il pannello di ricerca avanzata. Il titolo di una pagina web è solitamente mostrato in cima alla finestra del navigatore e nella  prima riga di descrizione dei risultati nella pagina dei risultati di Google. L’autore di un sito web specifica il titolo di una pagina con l’elemento HTML TITLE. C’è un solo titolo in una pagina web. Quando viene utilizzato allintitle: nella richiesta, non includete altri operatori di ricerca. La funzionalità di allintitle: è anche disponibile attraverso la pagina di Ricerca Avanzata.In ricerca Immagini, l’operatore allintitle: restituirà immagini in file i cui nomi contengono i termini di ricerca che avete specificato. In Google News, l’operatore allintitle: restituirà quegli articoli i cui titoli includono i termini specificati.
allinurl:
Se cominciate l’interrogazione con allinurl:, Google restringe i risultati alle pagine contenenti tutti i termini ricercati specificati nell’URL. Ad esempio, [ allinurl: google faq ] restituirà solo le pagine in cui le parole “google” e “faq” compaiono nell’URL, come “www.google.com/help/faq.html”. Questa funzionalità è ottenibile anche nella pagina di Ricerca Avanzata. Negli URL, le parole sono spesso attaccate. Esse non debbono essere attaccate quando usate allinurl:.In Google News, l’operatore allinurl: restituirà quegli articoli i cui titoli includeranno i termini specificati.Lo Uniform Resource Locator, meglio conosciuto come URL, è l’indirizzo che specifica la posizione di un file su Internet. Quando usate allinurl: nella vostra interrogazione, non includete alcun altro operatore.
author:
Se includete author: nella vostra interrogazione, Google restringerà i risultati fra quelli ottenibili cercando in Google Groups includendo tutti gli articoli newsgroup creati dall’autore specificato. L’autore può essere un nome completo o parziale oppure un indirizzo email. Ad esempio, [ children author:john author:doe ] o [ children author:doe@someaddress.com ] restituiscono gli articoli contenenti la parola “children” scritta da John Doe o doe@someaddress.com. Google cercherà esattamente ciò che avete specificato. Se la vostra interrogazione contiene [ author:”John Doe” ] (con le virgolette), Google non troverà gli articoli il cui autore è “Doe, John.”
cache:
L’interrogazione cache:url mostrerà la versione cache di Google di una pagina web, invece della versione corrente della pagina. Ad esempio, [ cache:www.eff.org ] vi mostrerà la pagina cache di Google della Electronic Frontier Foundation home page.

Nota: Non inserite spazi fra cache: e l’URL (indirizzo web).

Sulla versione cache di una pagina, Google evidenzierà quei termini nella vostra interrogazione che appaiono dopo l’operatore di ricerca cache:. Ad esempio, [ cache:www.pandemonia.com/flying/ fly diary ] mostrerà la versione cache di Google di Flight Diary in cui i documenti di Hamish Reid che gli hanno permesso di imparare a volare hanno evidenziati i termini “fly” e “diary”.

define:
Se cominciate l’interrogazione con define:, Google mostrerà definizioni da pagine sul web per i termini che seguono. Questo operatore di ricerca avanzata è utile per trovare definizioni di parole, frasi, e acronimi. Per esempio, [ define: blog ] vi mostrerà le definizioni per “Blog” (weB LOG).
ext:
Questo è un alias non documentato per filetype:.
filetype:
Se includete filetype:suffisso nella vostra interrogazione, Google restringerà i risultati alle pagine i cui nomi termineranno con il suffisso. Per esempio, [ web page evaluation checklist filetype:pdf ] restituirà i file Adobe Acrobat pdf che coincidono con i termini “web,” “page,” “evaluation,” e “checklist.” Potete restringere i risultati a quelle pagine i cui nomi finiscono con pdf e doc usando l’operatore OR, es. [  email security filetype:pdf OR filetype:doc ].Quando non specificate un formato di file nellla pagina di ricerca avanzata o l’operatore filetype:, Google cerca una varietà dei formati; vedi la tabella in conversione dei tipi di file.
group:
Se includete group: nell’interrogazione, Google restringerà i risultati agli articoli nei newsgroup di Google Groups provenienti da certe sottoaree. Ad esempio, [ sleep group:misc.kids.moderated ] restituirà gli articoli nel gruppo misc.kids.moderated che contiene la parola “sleep” e [ sleep group:misc.kids ] restituirà gli articoli nella sottoarea misc.kids che conterrà la parola “sleep.”
id:
Questo è un alias non documentato per info:.
inanchor:
Se includete inanchor: nella vostra interrogazione, Google restringerà i risultati alle pagine contenenti i termini dell’interrogazione specificati nell’anchor text o link alla pagina. Ad esempio, [ restaurants inanchor:gourmet ] restituirà le pagine in cui l’anchor text sui link delle pagine contiene la parola “gourmet” e la pagina contiene la parola “restaurants.”
info:
L’interrogazione info:URL mostrerà alcune informazioni sulla pagina web corrispondente. Ad esempio, [ info:gothotel.com ] mostrerà informazioni sulla home page della directory nazionale degli hotel GotHotel.com.

Nota: Non debbono esserci spazi fra info: e l’URL della pagina web.

Questa funzionalità può anche essere ottenuta scrivento l’URL della pagina web direttamente nella casella di ricerca di Google.

insubject:
Se includete insubject: nella vostra interrogazione, Google restringerà i risultati a quegli articoli di Google Groups che conterranno i termini specificati nel soggetto. Ad esempio, [ insubject:”falling asleep” ] restituirà quegli articoli di Google Groups che conterranno la frase “falling asleep” nel soggetto.E’ equivalente ad intitle:.
intext:
L’interrogazione intext:termine restringerà i risultati a quei documenti contenenti termine nel testo. Ad esempio, [ Hamish Reid intext:pandemonia ] restituirà quei documenti che menzionano la parola “pandemonia” nel testo, e menzionano i nomi “Hamish” e “Reid” ovunque nel documento (testo o meno).

Nota: Non debbono esserci spazi fra intext: e la parola successiva.

Mettendo intext: davanti ad ogni parola nell’interrogazione sarà equivalente a scrivere allintext: all’inizio della stessa, es., [ intext:handsome intext:poets ] è equivalente a [ allintext: handsome poets ].

intitle:
L’interrogazione intitle:termine restringe i risultati ai documenti contenenti termine nel titolo. Ad esempio, [ flu shot intitle:help ] restituirà quei documenti che menzionano la parola “help” nel loro titolo, e menzionano le parole “flu” e “shot” ovunque nel documento (titolo o meno).

Nota: Non debbono esserci spazi fra intitle: e la parola successiva.

Ponendo intitle: davanti ad ogni parola nell’interrogazione sarà equivalente a scrivere allintitle: all’inizio della stessa, es., [ intitle:google intitle:search ] è equivalente a [ allintitle: google search ].

inurl:
Se includete inurl: nell’interrogazione, Google restringerà i risultati a qui documenti contenenti quella parola nell’URL. Ad esempio, [ inurl:print site:www.googleguide.com ] cercherà le pagine di Google Guide in cui l’URL contiene la parola “print.” Troverà file pdf che sono nella directory o cartella denominata “print” sul sito di Google Guide. L’interrogazione [ inurl:healthy eating ] restituirà documenti che menzionano le parole “healthy” nel loro URL, e la parola “eating” ovunque nel documento.

Nota: Non debbono esserci spazi fra inurl: e la parola successiva.

Ponendo inurl: davanti ad ogni parola nell’interrogazione sarà equivalente a scrivere  allinurl: all’inizio della stessa, es., [ inurl:healthy inurl:eating ] è equivalente a [ allinurl: healthy eating ].

Le parole negli URL, sono spesso concatenate. Ma non dobbiamo concatenarle utilizzando inurl:.

link:
L’interrogazione con l’operatore link:URL mostra le pagine che puntano a quell’URL. Ad esempio, per trovare le pagine che puntano alla home page di Google Guide, immettere:[ link:www.googleguide.com ]

Nota: Secondo la  documentazione di Google, “non potete combinare una ricerca link: assieme ad una ricerca normale.”

Notate inoltre che se combinate link: con un’altro operatore avanzato, Google potrebbe non restituire tutte le pagine corrispondenti. La seguente interrogazione potrebbe restituire moltissimi risultati, come potete vedere se rimuovete il termine con l’operatore -site: in queste interrogazioni.

Trova le pagine che linkano la home page di Google che non siano sul sito di Google.

link:www.google.com -site:google.com ]

Trova le pagine che linkano la home page di UK Owners Direct che non siano sul proprio sito.

link:www.www.ownersdirect.co.uk -site:ownersdirect.co.uk ]

location:
Se includete location: nell’interrogazione su Google News, solo gli articoli di una determinata località che avete specificato saranno restituiti. Ad esempio, [ queen location:canada ] mostrerà gli articoli che contengono il termine “queen” fra i siti dal Canada. Molti altri paesi funzionano; provate e vedete. L’abbreviazione a due lettere degli stati in US filtra ciascuno degli stati, e funziona anche l’abbreviazione a due lettere delle province Canadesi (tipo NS per Nuova Scozia) – nonostante alcune province, non avendo molti giornali online, non vi permetteranno di ottenere molti risultati. Sono anche disponibili. alcune altre abbreviazioni di due lettere – come UK per United Kingdom.
movie:
Se includete movie: nell’interrogazione, Google troverà informazioni pertinenti i films. Ad esempio, vedete il  Google’s Blog.
phonebook:
Se iniziate una query con phonebook:, Google mostrerà tutti i telefoni disponibili sull’elengo pubblico degli U.S. (nome, indirizzo, numero di telefono) per le persone specificate. Ad esempio, [ phonebook: John Doe New York NY ] restituirà i telefoni di chiunque si chiama John Doe in New York, NY.
related:
L’interrogazione related:URL elencherà le pagine web simili alla pagina specificata. Ad esempio, [ related:www.consumerreports.org ] elencherà le pagine simili alla home page di  Consumer Reports.

Nota: Non debbono esserci spazi fra related: e l’url della pagina.

Potete trovare pagine simili anche dal link “Pagine simili” sulla pagina dei risultati di Google, e dal selettore simili nella pagina di ricerca avanzata (quest’ultimo non è più presente, n.d.t.). Se pensate di cercre frequentemente pagine simili, considerate l’installazione di GoogleScout browser button, che ricerca pagine simili.

site:
Se includete site: nell’interrogazione, Google restringerà i risultati della ricerca al sito o dominio specificato. Ad esempio, [ admissions site:www.lse.ac.uk ] mostrerà le informazioni pertinenti il termine “admission” sul sito London School of Economics e [ peace site:gov ] troverà le pagine con il termine “peace” sui domini .gov. Potete specificare un dominio con o senza punto, es., sia .gov che gov.

Nota: Non debbono esserci spazi fra site: ed il dominio.

Potete utilizzare molti degli operatori disponibili in congiunzione a site oltre agli operatori di base quali +, or, and " ". Ad esempio, per trovare informazioni sulla sicurezza di Windows che non provengano da microsoft.com, scrivete:

[  windows security –site:microsoft.com  ]

Potete anche restringere i risultati ad un sito o dominio dalla pagina di ricerca avanzata.

source:
Se includete source: nell’interrogazione, Google News restringerà la ricerca a quegli articoli provenienti dalla fonte che avete specificato. Ad esempio, [ election source:new_york_times ] restituirà gli articoli con la parola “election” fra quelli del New York Times. Per trovare l’ID di una fonte di notizie, immettete un’interrogazione che includa il nome della pubblicazione che cercate fra apici. Potete specificare il nome della sorgente anche nel campo di ricerca avanzata nel campo “fonte” del pannello di ricerca avanzata delle notizie. Troverete l’ID della fonte delle notizie nel campo della query, accanto all’operatore di ricerca source:. Ad esempio, supponiamo che immettiate “la repubblica” nel campo di ricerca Fonte, e poi cliccate sul pulsante di ricerca di Google. Apparirà la pagina dei risultati, e la casella di ricerca mostrerà [ notav source:"la repubblica" ]. Ciò significa che l’ID della fonte della notizia  è “la repubblica”. Questa interrogazione restituirà quegli articoli che contengono la parola “notav” dal giornale italiano “la repubblica”.
weather
Se inserite una query con la parola weather , o meteo ed una città o locazione, se Google riconosce il luogo, vi appariranno notizie sul tempo meteorologico in cima alla pagina dei risultati. Altrimenti, i risultati includeranno quei siti che trattano le previsioni del tempo per la locazione indicata. Poiché weather non è un operatore avanzato, non c’è necessità di inserire i due punti dopo la parola. Ad esempio, [ weather Sunnyvale CA ] restituirà le condizioni meteo per Sunnyvale, California e [ weather 94041 ] restituirà le condizioni meteo per le città con codice di avviamento postale (codice postale degli US) 94041, che corrisponde a Mountain View, California.

La Google Guide Advanced Operator Quick Reference (www.googleguide.com/advanced_operators_reference.html) fornisce un gradevole sommario degli operatori di ricerca raggruppati per tipo. Include anche quegli operatori di ricerca che non sono documentati da Google, es., allinanchor:allintext:author:ext:group:id:insubject:intext:intitle:location:,phonebook:, e source:.

Nota: Google potrebbe cambiare il funzionamento degli operatori non documentati od eliminarli completamente senza preavviso. Se notate cambiamenti negli operatori avanzati non documentati, fatecelo sapere.

Esercizi

Questi problemi sono disegnati per fornirvi esperienza con gli operatori di ricerca e pratica nello specificare meglio ciò che state cercando utilizzando il pannello di ricerca avanzata. Per suggerimenti  e risposte a determinati problemi, vedete la pagina delle Soluzioni.

    1. Usate l’operatore site: per cercare sedie sul sito dell’IKEA, www.ikea.com.
    2. Usate l’operatore allintitle: per trovare la pagina che nel titolo contiene “Plagio Online: Come Rilevare, Combattere E Segnalare Il Riutilizzo”.
    3. Trovare tutte le pagine su google.com ma non su answers.google.com o directory.google.com che includono le parole “FAQ” o “help.”
    4. Usate l’operatore link:per vedere chi punta su googleguide.com, il sito web della tua azienda, o il tuo sito preferito.
    5. Trova pagine i cui titoli includono la parola surfing, ma che non coincida con il surfing del World Wide Web.
    6. Trovare quando si terrà la prossima conferenza mondiale sull’AIDS.
    7. Come ricercare [ google help ] su Google Guide, www.googleguide.com, e sul sito web della libreria UC Berkeley, www.lib.berkeley.edu?

Share and Enjoy

  • Facebook
  • Twitter
  • Delicious
  • Digg
  • FriendFeed
  • Google Reader
  • StumbleUpon
  • Add to favorites
  • Email
  • RSS

Lascia un commento :, leggi...

Come funziona Google

by on gen.14, 2012, under Google Guide, Parte II: Comprendere i risultati, Web

Se non siete interessati a sapere come Google crea l’index ed il database dei documenti a cui accede quando processa una query, saltte questo capitolo. Ho adattato la seguente panoramica dalla meravigliosa descrizione di Chris Sherman e Gary Price su “”How Search Engines Work” nel capitolo 2 di The Invisible Web (CyberAge Books, 2001).

Google è eseguito su una rete distribuita di migliaia di calcolatori a basso costo che permette una veloce elaborazione di richieste parallele. Il “parallel processing” è un metodo computazionale in cui i calcoli possono essere performati simultaneamente, velocizzando significativamente l’elaborazione dei dati. Google ha tre parti distinte:

  • Googlebot, un web crawler che trova e recupera le pagine web.
  • L’indexer che ordina ogni parola su ogni pagina e salva i risultati in un indice di parole in un enorme database.
  • Il processore di query, che compara le vostre ricerche nell’indice e consiglia i documenti che considera più rilevanti.

Diamo un occhiata ravvicinata di ogni parte.

1. Googlebot, il Web Crawler di Google

Googlebot è il robot di Google che si occupa di ispezionare le pagine del web, esso trova e recupera le pagine nel web e le consegna al Google indexer. E’ facile immaginare il Googlebot come un piccolo ragno che corre velocemente attraverso i fili del cyber spazio, ma in realtà Googlebot non attraversa affatto il web. Esso funziona più come il vostro navigatore web, spedendo una richiesta ad un web server per una pagina web, scaricando l’intera pagina, e quindi passandola all’indexer di Google.

Googlebot è fatto da molti computer che richiedono e recuperano pagine molto più velocemente di come potreste fare con un web browser. Infatti, Googlebot può richiedere migliaia di pagine web simultaneamente. Per evitare di affaticare eccessivamente i web server, o sovraffollare le richieste provenienti da utenti umani, Googlebot deliberatamente fa richieste a ciascun web server più lentamente di quanto sia capace.

Googlebot trova le pagine in due modi: attraverso un form di aggiunta URL, www.google.it/addurl.html, e mediante la rilevazione dei links durante la lettura delle pagine web web (benchè ancora disponibile per gli utenti italiani, tale pagina è stata rimossa da Google in lingua inglese, ed integrata nella pagina webmaster tools, n.d.t.).

Screen shot of web page for adding a URL to Google.

Sfortunatamente, gli spammers hanno trovato il modo di creare bots automatizzati che bombardano il form di aggiunta URL con milioni di URL che puntano a propaganda commerciale. Google rigetta questi URL inviati mediante il form di aggiunta URL sospetti di fuorviare gli utenti utilizzando tattiche quali testo nascosto o pile di links verso una pagina, riempire una pagina di parole irrilevanti, cloaking (aka mordi e cambia), usando subdoli redirects, creando portali, domini, o sub-domini con contenuti sostanzialmente uguali, che spediscono richieste automatizzate a Google, e linking siti maliziosi. Perciò ora il form di aggiunta URL possiede anche un test: esso mostra alcune lettere distorte per far impazzire gli script automatizzati “indovina-caratteri”; vi chiede di trascrivere le lettere che vedete – qualcosa tipo un riconoscimento visivo per fermare gli spambots.

Quando Googlebot recupera una pagina, batte tutti i links che appaiono nella pagina e li aggiunge ad una coda per il successivo recupero. Googlebot tende ad incontrare un po di spam perché molti autori del web collegano solo ciò che ritengono siano pagine di alta qualità. Raccogliendo links da ogni pagina che incontra, Googlebot può velocemente costruire un elenco di links che possono coprire un ampia parte del web. Questa tecnica, conosciuta come deep crawling, permette inoltre a Googlebot di verificare la profondità per ciascun sito. A causa della loro vasta scala, i deep crawl possono raggiungere praticamente quasi tutte le pagine del web. A causa della vastità del web, puo volerci diverso tempo, cosicchè certe pagine possono essere scansite solo una volta al mese.

Nonostante il suo funzionamento sia semplice, Googlebot deve essere programmato per gestire diverse sfide. Primo, poiché Googlebot invia richieste simultanee per migliaia di pagine, la coda degli URL da “visitare al più presto” deve essere costantemente esaminata e comparata con gli URL già presenti nell’indice di  Google. I duplicati nella coda debbono essere eliminati per prevenire che Googlebot recuperi nuovamente la medesima pagina. Googlebot deve determinare quanto spesso rivisitare una pagina. Da una parte, è uno spreco di risorse re-indicizzare una pagina non cambiata. Dall’altra, Google vuole re-indicizzare le pagine mutate per fornire risultati aggiornati.

Per mantenera l’indice aggiornato, Google riesamina continuamente le pagine web più popolari che cambiano più di frequente con una frequenza proporzionale alla velocità dei cambiamenti. Questi aggiornamenti rendono l’indice attuale e sono meglio noti come fresh crawls. Le pagine dei giornali sono scaricate giornalmente, le pagine di quotazione dei titoli sono scansite più frequentemente. Naturalmente, i fresh crawls restituiscono meno pagine di un esame approfondito (deep crawl). La combinazione dei due tipi di esame permette a Google di mantenere l’indice aggiornato e di risparmiare risorse in modo ragionevole.

2. L’indicizzatore di Google’s

Googlebot fornisce all’indicizzatore il testo completo delle pagine che esamina. Queste pagine sono registrate nel database dell’indice di Google. Questo indice è ordinato alfabeticamente per termine di ricerca, per ogni termine dell’indice sono associati una serie di documenti in cui appaiono i termini e la locazione dove il testo è individuato. Questa struttura di dati permette un accesso rapido ai documenti che contengono i termini di ricerca utente .

Per migliorare le prestazioni delle ricerche, Google ignora (non indicizza) le parole comuni chiamate stop words (come ilèsuo, dicomeperché, come anche certi singoli caratteri o lettere). Le stop words sono così comuni che sono poco significative per raffinare una ricerca, perciò possono essere tranquillamente scartate. L’ indexer ignora anche alcune puntualizzazioni e spazi multipli, oltre a convertire tutti i testi in lettere minuscole, per migliorare le prestazioni di Google.

3. Il processore di query di Google

Il processore di query è composto da diverse parti, inclusa l’interfaccia utente (il campo di ricerca), l’“engine” che valuta le interrogazioni e trova i riscontri nei documenti più rilevanti, ed il formattatore dei risultati.

PageRank è il sistema di Google per dare una graduatoria alle pagine web. Una pagina con un PageRank più elevato è considerata più importante e sarà probabilmente posta più in altro rispetto ad una pagina con un PageRank inferiore.

Google considera oltre cento fattori per estrapolare il suo PageRank e determinare quali documenti sono più rilevanti per un interrogazione, inclusa la popolarità della pagina, la posizione ed il numero dei termini di ricerca all’interno della pagina, e la prossimità fra i termini di ricerca nella pagina. Un applicazione sui brevetti enumera altri fattori che Google considera quando formula il rank di una pagina. Visitate SEOmoz.org’s report per un interpretazione sui concetti e l’applicazione pratica contenuta nell’applicativo brevettato da Google.

Google applica anche tecniche di apprendimento-macchina per migliorare automaticamente le sue prestazioni imparando le relazioni e le associazioni frai dati immagazzinati. Ad esempio, il sistema di correzione ortografica usa queste tecniche per suggerire parole alternative. Google presta molta attenzione alle formule impiegate per calcolare la rilevanza; essi sono adattati per migliorare la qualità e le prestazioni, ed evitare le tecniche devianti degli spammers.

Indicizzare tutto il testo del web permette a Google di andare oltre il semplice riscontro dei termini di ricerca. Google da più priorità alle pagine che hanno termini vicini fra loro e nello stesso ordine dell’interrogazione. Google può anche trovare corrispondenze con parole multiple frasi e sentenze. Poiché Google indicizza il codice HTML oltre al testo della pagina, gli utenti possono restringere le ricerche sulla base di dove le parole delle interrogazioni compaiono, es., nel titolo, nell’URL, nel body, e nei link della pagina, opzioni offerte dal form di ricerca avanzata di Google ed Usando gli Operatori Avanzati.

Vediamo come Google processa un’interrogazione.

1. The web server sends the query to the index        servers. The content inside the index servers is similar        to the index in the back of a book--it tells which pages        contain the words that match any particular query       term.          2. The query travels to the doc servers, which   actually retrieve the stored documents. Snippets are    generated to describe each search result.       3. The search results are returned to the user          in a fraction of a second.

Per maggiori informazioni su come funziona Google, leggete i seguenti articoli.

Share and Enjoy

  • Facebook
  • Twitter
  • Delicious
  • Digg
  • FriendFeed
  • Google Reader
  • StumbleUpon
  • Add to favorites
  • Email
  • RSS

Lascia un commento :, leggi...

La pagina dei risultati

by on dic.30, 2011, under Google Guide, Parte II: Comprendere i risultati, Web

La pagina dei risultati è piena di informazioni e links, molti dei quali correlati alla vostra ricerca.

 

 

  • Google Logo: Cliccate sul logo di Google per andare sulla pagina di Google.
  •  Barra delle statistiche: Descrive la ricerca, include i la quantità dei risultati stimati, ed il tempo di ricerca necessario. Per motivi di efficienza, Google stima il numero dei risultati; ci vorrebbe molto più tempo per computare il numero esatto. Questa stima non è affidabile.
  • Suggerimenti: Talvolta Google mostra dei suggerimenti appena sotto la barra delle statistiche.
    Screen shot of a Google tip
  • Risultati della ricerca: Ordinati per rilevanza per la vostra richiesta, con i risultati che Google considera i più rilevanti elencati per primi. Di conseguenza potreste velocemente trovare ciò che cercate guardando velocemente i risultati nell’ordine in cui appaiono. Google accerta la rilevanza considerando più di un centinaio di fattori, inclusa la quantità di pagine che linkano la pagina, la posizione dei termini di ricerca all’interno della pagina, e la prossimità fra un termine di ricerca ed un altro.Seguono le descrizioni di alcuni componenti dei risultati della ricerca. Queste componenti appaiono con fonts di colori differenti sulla pagina dei risultati per rendere semplice distinguerli.
    • Titolo della pagina: (blue) Il titolo della pagina web, se la pagina ha un titolo, o il suo URL se la pagina non ha titolo o se Google non ha indicizzato il contenuto completo della pagina. Cliccate sul titolo della pagina (es., Adamantio – Wikipedia) per visualizzare la pagina corrispondente.
    •  Snippets: (nero) Ciascuna pagina dei risultati solitamente include uno o più brevi estratti del testo che coincidono con la vostra richiesta con i vostri termini di ricerca in grassetto. Ciascun estratto o snippet è separato da un ellissi (…). Questi frammenti, che appaiono con un font di colore nero, possono fornirvi informazioni su
      • Le informazioni che stavate cercando
      • Cosa pensavate di trovare sulla pagina collegata
      • Idee sui termini da utilizzare nella ricerca successiva

      Quando Google non ha indicizzato la pagina, il risultato non includerà il frammento. Una pagina potrebbe non essere stata indicizzata perchè il suo editore ha richiesto di non indicizzarla, o perchè la pagina è stata scritta in un modo difficilmente interpretabile dal bot di google.

    • URL dei risultati: (verde) L’indirizzo web del risultato della ricerca. Nella schermata (sotto si vede meglio), l’ URL del primo risultato è it.wikipedia.org/wiki/Adamantio.
    • Data e numero di visite: (grigio) Se avete avuto accesso ai servizi Google la data vi indica l’ultima volta che avete visitato il sito e quante volte lo avete visitato.
    • Risultati nidificati: Quando Google trova molteplici risultati nello stesso sito web, elenca le pagine successive in forma indentata rispetto al risultato principale. Nella schermata, vediamo i risultati indentati per il sito www.adamantio.net. Limitando il numero dei risultati da un dato sito google si assicura che l’intera pagina dei risultati non sia monopolizzata da una sola sorgente bensì popolata da più siti web diversi.
    • Più risultati: Quando ci sono più risultati che provengono da uno stesso sito, l’accesso ai siti rimanenti viene garantito con il link “Più risultati da…” . Quando Google restituisce più di una pagina di risultati, potete vedere le pagine successive cliccando sulle “o” o sui numeri che appaiono  nella stravagante scritta “Goooooooooogle” in fondo alla pagina dei risultati di ricerca.
    • Se avete disattivato la caratteristica dell’”instant search” nelle preferenze utente generali, considerate di aumentare il numero dei risultati che Google mostra nella pagina dei risultati.In pratica, comunque, se le pagine che vi interessano non sono frai primi 10 risultati, considerate di raffinare la vostra richiesta al posto di navigare fra le pagine di risultati irrilevanti. Per semplificare tale raffinamento, Google include un campo di ricerca in cima alla pagina e diversi link ai con i risultati correlati in fondo alla pagina.
  • Link sponsorizzati: I risultati possono includere dei link a siti sponsorizzati (annunci pubblicitari), chiaramente indicati da uno sfondo rosa e dalla scritta “Annuncio”, rilevanti per la vostra ricerca. Se compare almeno un termine della vostra ricerca nell’annuncio, Google lo evidenzierà mostrandolo  in grassetto.
  • Correttore ortografico, Definizioni di dizionarioPagine cacheSimiliNotizieInformazioni sui prodottiTraduzioneRisultati per i libri: I vostri risultati potrebbero includere questi links, che saranno descritti nei prossimi capitoli.

Ecco un’altra schermata della pagina dei risultati in caso quella superiore fosse uscita dallo schermo o fosse poco leggibile.

 

Screen shot indicating what is shown on a Google results page.

 

Per maggiori informazioni su cos’è incluso nella pagina dei risultati di Google, visita www.google.com/help/interpret.html.

Share and Enjoy

  • Facebook
  • Twitter
  • Delicious
  • Digg
  • FriendFeed
  • Google Reader
  • StumbleUpon
  • Add to favorites
  • Email
  • RSS

Lascia un commento :, leggi...

Cerchi qualcosa?

Usa il form sottostante per cercare nel sito:

Non hai trovato ancora ciò che cercavi? Lascia un commento su un post o contattaci affinché possiamo fare qualcosa!

Google custom search

Cerca nel sito con Google: