В Google стався масовий витік документації, що описує роботу алгоритмів пошуку. Тепер компанію звинувачують у брехні
2500 сторінок документів Google щодо пошукового алгоритму, які, ймовірно, походять з внутрішнього сховища Content API Warehouse Google, були опубліковані 13 березня на GitHub автоматизованим ботом під назвою yoshi-code-bot. Тепер Google звинувачують у брехні, але сама компанія поки що відмовляється коментувати ситуацію.
Ці документи були передані співзасновнику SparkToro Ренду Фішкіну, який провів їхній аналіз. Серед висновків: Google використовує «рейтинг довіри» та кліки для ранжування результатів, збирає дані з Chrome, аби підлаштувати пошукову видачу під користувача та регулює популярність малих сайтів.
Що всередині
- SiteAuthority: Google використовує щось, що називається «siteAuthority». Компанія повідомляла про існування подібного в 2011 році, після запуску оновлення Panda, публічно заявивши, що «низькоякісний контент на частині сайту може вплинути на ранжування сайту загалом». Однак з тих пір Google заперечує наявність показника авторитетності сайту.
- Дані Chrome: модуль під назвою ChromeInTotal вказує на те, що Google використовує дані зі браузера Chrome для ранжування (тобто коригує результати пошуку під користувача).
- Білі списки: кілька модулів вказують на те, що Google вносить до білих списків певні домени, пов’язані з виборами та COVID — isElectionAuthority та isCovidLocalAuthority. Про «списки винятків», коли «певні алгоритми ненавмисно впливають на вебсайти», вже було відомо раніше.
- Авторство живе: Google зберігає інформацію про автора, пов’язану з контентом, і намагається визначити, чи є організація автором документа.
- SmallPersonalSite: ще одна функція для невеликого персонального сайту або блогу. Є припущення, що Google може підвищувати або знижувати такі сайти за допомогою Twiddler. Однак це залишається відкритим питанням.
- Історія змін: Google, очевидно, зберігає копію кожної версії кожної сторінки, яку коли-небудь індексував. Це означає, що пошуковик може «пам’ятати» кожну зміну, коли-небудь зроблену на сторінці.
- Успішні кліки мають значення. Google використовує різні вимірювання, зокрема badClicks, goodClicks, lastLongestClicks і unsquashedClicks.
Що думаєте про цю ситуацію? Як вважаєте, чи матиме це мажорний вплив на репутацію компанії?
4 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів