PDA

Visualizza versione completa : Social&Web Google lancia la nuova indicizzazione Caffeine



janet
09-06-10, 22: 31
La nuova tecnologia, testata per oltre un anno è stata finalmente lanciata e rinnoverà completamente la ricerca, rendendola più veloce che si tratti di una notizia in un blog o di un post su un forum ora si potranno trovare i link, subito dopo la pubblicazione.
A suo tempo Google disse che Caffeine sarebbe stato il cambiamento più significativo, riguardante la scansione di internet ed il posizionamento delle pagine web, dal 2006.
Il sistema funziona frazionando il web in piccole parti, delle quali viene aggiornato frequentemente l'indice, piuttosto che scansionare ogni volta l'intero web.
Secondo Google, Caffeine rappresenta (http://ilblogdijanet.blogspot.com/2010/06/google-lancia-la-nuova-indicizzazione.html)il futuro e permetterà agli sviluppatori di costruire un motore sempre più aggiornato ed al passo con la mole in aumento dei contenuti on line e permetterà agli utilizzatori finali di ottenere più risultati di ricerca pertinenti.
C'è ora solo da provare, se nelle prossime settimane la ricerca sarà più veloce ed aggiornata

Pegaso
11-06-10, 09: 32
Ciao Janet,
speriamo... ma il caffè (ecco perchè è più veloce... è più nervoso! :bgg2 ), è già integrato nella pagina di ricerca di Google che usiamo normalmente? :boh

Thund3r
12-06-10, 11: 48
Approfondendo :)


Risultati più aggiornati e un indice di contenuti web che Google definisce come la pù grande collezione di contenuti web mai offerta. E’ questo il senso del nuovo sistema di indicizzazione del search di Google che è appena stato completato e messo on line. Oggi Internet è fatta molto di più di immediatezza e contenuti che vengono aggiornati continuamente durante il giorno: sia che si tratti di un articolo di giornale o di un post di un blog o di un forum, ciò che gli utenti chiedono e anche gli editori, è che nei risultati di ricerca compaia il link al contenuto più aggiornato. Ma per com’era congegnato l’indice del search di Google, questa operazione di update e indicizzazione quasi in tempo reale era praticamente impossibile. Fino a oggi quando si faceva una ricerca con Google –spiegano sul blog — il motore non andava a indicizzare il web in tempo reale, ma effettuava le ricerche sull’indice di Google, che funziona un po’ come l’indice di un libro dove le informazioni sono suddivise in modo che si possa trovare più facilmente ciò che si cerca.

Il vecchio indice di Google era suddiviso in tanti livelli ciascuno dei quali aveva una velocità di aggiornamento diversa (il principale veniva aggiornato ogni quindici giorni) ma ogni volta per fare il refresh di un livello dell’indice occorreva analizzare l’intero web. Caffeine invece segue un’architettura diversa, non più a livelli sovrastanti, ma ad atomi: il web viene analizzato e spezzettato in tante piccoli porzioni rendendo quindi l’aggiornamento dei contenuti più rapido, sia che si tratti di una pagina web o di una nuova informazione immessa all’interno di quest’ultima. Il risultato è che Caffeine consente di avere informazioni più aggiornate del 50% rispetto all’indice precedente e è in grado di elaborare ogni secondo centinaia di migliaia di pagine in parallelo. Caffeine raccoglie qualcosa come 100 milioni di gigabyte di dati memorizzati in un unico database e aggiunge ogni giorno centinaia di migliaia di gigabyte di nuove informazioni. Ci vorrebbero oltre 625.000 iPod dei più capienti per memorizzare tuta questa mole di dati. Video, immagini, file musicali, post dei blog, update di status, ora la rete è monitorata in tempo reale.

janet
13-06-10, 04: 35
è già integrato nella pagina di ricerca di Google che usiamo normalmente? è che sicuramente la fonte usata è la stessa, perchè riconosco le frasi, comunque nello stesso articolo si diceva che non si sapeva se il processo sarebbe stato attuato in un'unica nottata, perchè partiva dal martedi notte o a fasi successive ed in ogni caso ci voleva un pò di tempo per accorgersene, invece io per ora ho notato meno aggiornamenti di prima, non vorrei che magari ci sono pezzi di web aggiornati più spesso ed altri che magari verranno penalizzati, mentre prima si riindicizzava tutto insieme, vediamo un pò.