SEO: Ce putem invata despre Google de la Yandex (cod sursa)

  • 11 minute citit
google yandex

Codul sursa al Yandex a fost facut public de un fost angajat in 25 februarie 2023, asa ca acum stim care sunt cele mai importante semnale de clasificare pentru acest motor de cautare dar si pentru Google deoarece sunt foarte similare.

Nu voi pune link catre aceste documente deoarece nu are valoare daca nu esti programator insa o cautare rapida pe Google sau pe retelele sociale ar trebui sa te ajute sa le gasesti rapid.

yandex-3

Chiar daca nu ne intereseaza Yandex (utilizat in principal in Rusia), aceasta stire este semnificativa. Este o perspectiva directa asupra functionarii interne a unui concurent cu drepturi depline al Google.

Yandex este al 4-lea motor de cautare iar compania care-l detine furnizeaza servicii similare cu Google si nu numai (Netflix, etc).

Sa vedem ce putem invata din aceasta scurgere de informatii despre cum sa facem un SEO mai bun. Voi discuta unele dintre cele mai interesante variabile pe care le-am gasit si modul in care acestea pot informa gandirea noastra despre cautare.

Arhiva Yandex care a facut obiectul scurgerilor, include date tehnice si coduri despre:

  • Motorul de cautare Yandex si robotul de indexare
  • Harti Yandex
  • Alice (asistent AI)
  • Yandex Taxi
  • Yandex Direct (serviciu de anunturi)
  • Yandex Mail
  • Yandex Disk (serviciu de stocare in cloud)
  • Yandex Market
  • Yandex Travel (similar cu Booking.com)
  • Yandex360
  • Yandex Cloud
  • Yandex Pay (serviciu de procesare a platilor)
  • Yandex Metrika (similar cu Google Analytics)

Pentru un programator, toate aceste lucruri sunt mai mult decat "bine venite", au un total de aproape 45Gb. 

Compania a informat presa rusa ca este la curent cu scurgerea de informatii si ca a fost demarata o ancheta pentru a determina cum au ajuns "fragmente din codul sursa" in domeniul public.

Yandex a subliniat ca nu a fost vorba de hacking:

"Yandex nu a fost piratata. Serviciul nostru de securitate a gasit fragmente de cod dintr-un depozit intern aflat in domeniul public, dar continutul difera de versiunea actuala a depozitului utilizat in serviciile Yandex".

"Un depozit este un instrument pentru stocarea si lucrul cu codul. Codul este utilizat in acest mod la nivel intern de majoritatea companiilor".

Yandex colecteaza informatii despre utilizator

Sarcina unui motor de cautare precum Google, Yandex sau Bing este de a raspunde la interogarea unui utilizator.

Dar pentru a raspunde la acea interogare, aceasta trebuie sa fie inteleasa. Deci intentia specifica a utilizatorului trebuie sa fie dedusa din tot ceea ce motorul de cautare stie despre acesta.

Acesta este motivul pentru care motoarele de cautare colecteaza cat mai multe informatii despre utilizator, cum ar fi cautarile anterioare, locatia sau dispozitivul.

Yandex nu este diferit si gasim dovezi in acest sens in datele scurse. De exemplu, Yandex colecteaza variabila FI_REQUEST_IS_FROM_IOS, care verifica daca un anumit utilizator se afla pe un dispozitiv iOS.

Yandex colecteaza tone de date despre site-uri web

Yandex, la fel ca Google si Bing, are un index de pagini care ar putea raspunde nevoilor utilizatorilor. Pentru a gasi paginile cele mai potrivite pentru a-i ajuta pe utilizatori, trebuie sa le analizeze minutios.

Scurgerea scoate la suprafata tone de variabile legate de pagini si domenii, folosite de Yandex ca semnale de clasificare.

Mai jos sunt cateva exemple care mi s-au parut cele mai interesante dar si surprinzatoare.

  • Yandex verifica daca o pagina are implementat vreun serviciu de harti (FI_PAGE_HAS_MAPS_API),
  • Yandex judeca calitatea unei date folosind calitatea generala a gazdei - site-ul web (FI_PAGE_QUALITY_HOST),
  • Yandex verifica daca nu exista continut NSFW, inclusiv text, imagini si videoclipuri,
  • Yandex verifica daca un document contine feedback/comentariile utilizatorilor,
  • Yandex judeca pagina in functie de data ultimei modificari si de numarul de duplicate cunoscute,
  • Yandex acorda atentie postarilor sociale de la conturi verificate care au un link catre o anumita pagina.

Exista peste 18.000 factori diferiti de care Yandex tine cont. Cred ca merita sa fie studiati, dar este dincolo de scopul acestui post. Vreau doar sa va atrag atentia asupra gamei vaste de analize pe care Yandex le face pentru a clasifica toate paginile din indexul sau.

Yandex foloseste masuratori ale comportamentului utilizatorilor

La fel ca Bing, Yandex utilizeaza masuratori comportamentale pentru a semnala calitatea paginilor.

Timpul petrecut pe timp conteaza:

  • FI_BROWSER_HOST_CNT_DWELL_TIME_LOG verifica timpul mediu petrecut de un utilizator pe un anumit site web - aceste date sunt segmentate in functie de localizare si de tara,
  • FI_MORE_90_SEC_VISITS_SHARE verifica procentul de vizite mai lungi de 90 de secunde,
  • FI_MORE_160_SEC_VISITS_SHARE verifica procentul de vizite mai lungi de 160 de secunde.
yandex-2

Yandex utilizeaza si popularitatea imediata ca factor de clasificare. Acesta masoara numarul mediu de vizite in decurs de trei ore.

De asemenea, ei iau in considerare cat de profund interactioneaza utilizatorul mediu cu site-ul web (adancimea medie a sesiunii).

Acest lucru indica similitudini intre Yandex si Bing.

Din documentatia Bing:

Bing ia in considerare modul in care utilizatorii interactioneaza cu rezultatele cautarii. Pentru a determina implicarea utilizatorilor, Bing pune intrebari precum: "Cum ar fi: Utilizatorii au facut clic pe rezultatele cautarii pentru o anumita interogare si, daca da, pe care rezultate? Utilizatorii au petrecut timp pe aceste rezultate de cautare pe care au facut clic sau s-au intors rapid la Bing? Si-a ajustat sau reformulat utilizatorul interogarea?

Yandex foloseste algoritmi asemanatori cu cei de la Google

Scurgerea de informatii arata mai multi factori care corespund direct sau indirect unora dintre mecanismele pe care stim ca le foloseste Google.

  • Atat Google, cat si Yandex folosesc BERT.
  • Atat Google, cat si Yandex utilizeaza semnale de calitate la nivelul intregului site, in loc sa utilizeze doar semnale la nivel de pagina (cum ar fi FI_PAGE_QUALITY_HOST).
  • Atat Google, cat si Yandex utilizeaza PageRank.
  • Yandex are, de asemenea, reguli pentru anumite site-uri web. De exemplu, Yandex trateaza in mod diferit linkurile Wikipedia. Yandex are, de asemenea, reguli pentru anumite site-uri web. De exemplu, exista un factor numit FI_DSSM_SUNHOME_POPULARITY. Acesta verifica probabilitatea ca sunhome.ru sa fie o gazda populara pentru aceasta interogare.
  • Atat Google, cat si Yandex au o notiune de pagini YMYL. Yandex are un algoritm specific pentru a detecta calitatea gazdei pentru site-urile medicale (FI_MEDICAL_HOST_QUALITY_METRIC"). De asemenea, are modele neuronale pentru a detecta calitatea continutului pentru subiecte financiare si juridice (FI_FIN_LAW_URL_QUALITY).
  • Ambele motoare de cautare pot adnota diferite parti ale continutului (astfel incat sa inteleaga aspectul paginii). Stim ca Google utilizeaza un mecanism de adnotare a piesei centrale pentru a face diferenta intre continutul principal, continutul suplimentar si reclamele.
  • Atat Google, cat si Yandex impartasesc unii factori de clasificare de baza comuni (cum ar fi prietenia cu dispozitivele mobile, pe care Yandex o masoara cu variabila FI_IS_MOBILE_BEAUTY_HOST).

Cum sa folosesti datele Yandex pentru a face un SEO mai bun

Atunci cand cunoasteti semnalele de calitate si relevanta pe care un motor de cautare le foloseste pentru a scoate la suprafata cel mai bun continut, este destul de usor sa va imbunatatiti clasamentul.

In primul rand, verificati care sunt factorii de clasificare care au cel mai mare impact (nu toti au o pondere egala in algoritmul de clasificare). Apoi, selectati factorii care pot fi actionati si care sunt usor de imbunatatit. Concentreaza-te pe imbunatatirea acestor factori pe site-ul tau si masoara impactul.

Nu ma astept ca Yandex sa isi rescrie baza de cod pentru a impiedica oamenii sa se joace cu algoritmul sau. Asadar, daca doriti sa va imbunatatiti clasamentul Yandex, acum este mai usor ca niciodata (din punct de vedere tehnic).

Cand vine vorba de Google, lucrurile nu sunt atat de usoare.

Daca comparati rezultatele cautarilor pentru aceleasi interogari intre Google, Yandex si Bing, veti observa rapid diferente semnificative. Acest lucru indica faptul ca, chiar daca folosesc semnale de clasificare similare, acestea le cantaresc diferit sau le folosesc pentru tipuri de interogari diferite.

Dar scurgerea de informatii de la Yandex este o oportunitate extraordinara pentru programatori (reverse engineering) in ceea ce priveste modul in care gandesc cei care conduc unul dintre cele mai de succes motoare de cautare din lume.

Studiati aceste documente pentru a intelege cum va vede un motor de cautare afacerea si ce puteti face pentru a va imbunatati vizibilitatea in cautare.

yandex-1

Dupa cum se vede in imagine, chiar daca stii toti algoritmii pe derost (putin probabil) sunt incredibil de multe detalii iar fiecare din ele valoreaza un scor (care nu e tocmai mare). Fiecare scor adauga sau scade din punctajul final.

Asadar, expertii SEO nu au fost in realitate niciodata experti ci doar exploatatori, dupa cum am mai spus in articolul SEO fara backlink-uri.

Lectia 1: Semnale de clasificare, nu factori de clasificare

Exista o discutie in randul expertilor SEO despre ce este un factor de clasificare si ce nu este. Trebuie sa ne schimbam modul de gandire pentru a reflecta faptul ca ne aflam in era invatarii automate.

Sa luam doua exemple: greselile gramaticale si numarul de cuvinte. Google neaga oficial ca ambele sunt factori de clasificare. Totusi, este posibil ca ele sa contribuie la succesul tau SEO.

Google a publicat o lucrare de cercetare despre detectarea continutului foarte calitativ. Esantionul a fost extraordinar - 500M de documente. Algoritmul descris a luat in considerare caracteristici precum numarul de cuvinte si corectitudinea gramaticala. Sunteti surprins?

Numarul de cuvinte nu este un factor de clasificare, in sensul ca documentele cu un numar mai mare de cuvinte vor obtine o pozitie mai buna.

Dar, in mod evident, poate fi folosit ca un semnal de clasificare. In functie de interogare si de utilizator, algoritmul de clasificare il poate folosi sau nu ca factor de sortare a rezultatelor cautarii.

Lectia 2: Cautarea este mai complexa decat credem noi

Urmarim factori de clasificare specifici si masurabili si continuam sa cautam raspunsuri directe la intrebari simple precum "Este numarul de cuvinte un factor de clasificare?".

Conform scurgerii de informatii, Yandex foloseste 18000 de semnale de clasificare diferite. In mod similar cu Bing si Google, este un motor de cautare de ultima generatie.

Va asteptati ca Google sau Bing sa foloseasca doar 200 de factori de clasificare, asa cum toti "expertii" SEO spun pe internet (e clar ca se copiaza unul pe altul)? Si va asteptati ca vreun angajat al Google sa si-i aminteasca pe toti?

Urmarind o mana de indicatori masurabili, probabil ca nu veti avea succes.

In schimb, ganditi-va cum sa faceti un SEO bun. Pe drumul spre autoperfectionare, nu va puteti concentra doar pe un singur lucru. In schimb, adoptati perspectiva motoarelor de cautare pentru a intelege locul pe care paginile site-ului il pot si ar trebui sa il ocupe in SERPs. Apoi, faceti ca acele pagini sa fie de neuitat, astfel incat sa nu va multumiti doar sa dobanditi trafic, ci sa il faceti sa lucreze in vederea atingerii obiectivelor finale.

Mult spor!
Daca ti-a fost de ajutor, ne poti ajuta si tu cu un share (click pe iconita de jos).

Resurse

Spune și prietenilor tăi despre articol

Articole similare

Afaceri online