I Google Leak sono dei documenti che si dicono provenire dall’archivio interno di Google condivisi agli inizi di maggio 2024 da Erfan Azimi su Githhub . Si tratta di circa 2.500 pagine di documenti che descrivono dettagli tecnici relativi al funzionamento dell’algoritmo di Google che offrono una visione allargata dei meccanismi interni della ricerca di Google.
Google è storicamente molto attenta a proteggere il segreto del suo algoritmo e della ricerca e ha confermato la fuga di documenti ma ha voluto attraverso un suo portavoce: “mettere in guardia dal fare supposizioni inaccurate su come funziona Search basate su informazioni decontestualizzate, obsolete o incomplete “.
Ecco un elenco degli elementi che deteminano il Search di Google secondo i Google Leak di Maggio 2024
- 1. Site Authority: metrica che misura l’autorità complessiva di un sito web
 - 2. Click Data: dati come “goodClicks” e “badClicks” per valutare la qualità delle interazioni degli utenti
 - 3. NavBoost: Sistema che migliora il ranking basandosi su dati di navigazione degli utenti
 - 4. Human Raters: i documenti realizzati da valutatori umani possono ricevere un peso maggiore nei risultati di ricerca
 - 5. Sandbox: Meccanismo che limita il ranking dei nuovi siti web per prevenire manipolazioni e spam
 - 6. PageRank: Valuta l’importanza di una pagina web basandosi sui link entranti
 - 7. Freshness: Importanza dei contenuti aggiornati e freschi, valutando la data di pubblicazione e le modifiche recenti per mantenere i risultati rilevanti
 - 8. Brand Signals: Segnali legati alla notorietà del brand offline e online, influenzando il ranking e la fiducia degli utenti
 - 9. User Experience: desperienza utente come velocità del sito, compatibilità mobile e interattività
 - 10. Content Type Specificity: Google assegna un trattamento speciale a determinati tipi di contenuti durante eventi critici come elezioni e pandemie
 - 11. Truncation and Length Scores: Google valuta la lunghezza dei documenti, con punteggi basati sull’originalità del contenuto, ma documenti troppo lunghi possono essere tranciati
 - 12.YMYL (Your Money Your Life) Content Scores: Contenuti critici come salute e finanza ricevono un punteggio specifico
 - 13. TitlematchScore: Valuta quanto il titolo di una pagina corrisponde alla ricerca dell’utente
 - 14. Average Term Weight: Misura il peso medio delle parole chiave nei documenti e nei testi di ancoraggio,
 - 15. RegistrationInfo: le informazioni di registrazione del dominio per valutarne la legittimità e affidabilità
 - 16. Vectorization and Embeddings: Utilizza la vettorizzazione per confrontare pagine e siti web con altre pagine simili
 - 17. Syntactic and Semantic Dates: Analizza le diverse date associate ai contenuti per determinarne la freschezza,
 - 18. Whitelisting: Certi domini ricevono un trattamento speciale, come quelli relativi a elezioni e COVID-19
 - 19. ChromeInTotal: Google utilizza dati dal browser Chrome per valutare il comportamento degli utenti
 - 20. SmallPersonalSite: Indica un trattamento specifico per piccoli siti personali o blog
 - 21. Golden Document Flag: Documenti etichettati manualmente da valutatori umani ricevono un peso maggiore nel ranking
 - 22. Link Diversity: La diversità e la rilevanza dei link sono importanti per il ranking, esaltando l’importanza dei link di qualità
 - 23. Font Size Weight: Misura la media ponderata dei termini nei documenti per valutare l’importanza delle parole chiave
 - 24. Successful Clicks: “lastLongestClicks” e “unsquashedClicks” per determinare il valore delle interazioni utente
 - 25. Core Topic Relevance: Valutazione della la pertinenza dei documenti ai temi principali del sito
 - 26. Neural Search: Algoritmo che modifica il PageRank basato su lettura e comprensione dei documenti
 - 27. Page Quality : Stima l’impegno richiesto per una pagina, migliorando la qualità dei risultati
 - 28. SiteFocusScore: Identifica quanto un sito è focalizzato su un argomento specifico
 - 29. SiteRadius: Misura la distanza tra i PageEmbeddings e i SiteEmbeddings
 - 30. Hosting Quality : Valutano l’ottimizzazione del servizio hosting, misurando la velocità e affidabilità del sito
 - 31. IsElectionAuthority: siti con autorità indiscussa in determinati settori
 - 32. Proximity Targeting: targeting di prossimità, migliorando la rilevanza locale dei risultati
 - 33. Page Embeddings: embedding per oggetti in un formato comprensibile dai computer,
 - 34. Unicorn Clicks: Misura i clic rari o unici per valutare la qualità del contenuto
 - 35. Glue: altre caratteristiche della pagina
 - 36. Sitelinks: Utilizza il numero di clic su pagine nei browser Chrome per determinare gli URL più importanti su un sito
 - 37. Ewok Ratings: Valutazioni di qualità da parte di revisori umani che possono influenzare il ranking
 
  Ricevi le nostre ultime notizie da Google News - SEGUICI
Iscriviti alla nostra newsletter per essere aggiornato sulle nostre attività e sul nostro sito
.
Seguici  su Facebook ,  Twitter ,  Linkedin.
