Google – indexarea conținutului dinamic JavaScript

Am dezbătut în repetate rânduri care sunt factorii de ranking Google, cei importanți și cei secundari, principiile de dezvoltare și optimizare a website-urilor pentru orice tip de dispozitiv, Desktop sau Mobile. Este important să știm și în ce mod evoluează tehnologia ce stă la baza roboților care analizează și apreciază site-urile noastre și modul de optimizare.

În ce măsură optimizările de tip text, link-uri, tag-uri etc. sunt citite și interpretate corect de acești roboți de indexare și ranking Google.

Testele efectuate de specialiștii Searchengineland.com pe diferite tipuri de conținut dinamic cod JavaScript și rezultatele acestora:

1. Redirecturi în JavaScript

Testul a avut ca obiect funcția JavaScript Window Location și fost testate link-uri redirectate cu redirect 301, atât URLuri absolute (care conțin sintaxa completă: http + domeniu web + denumire pagină ), cât și URL-uri relative (care conțin numai /denumire pagină).

Google a indexat cele două URL-uri către care s-a făcut redirect în codul JavaScript iar paginile respective au obținut repede același ranking ca și paginile vechi (de la care s-a efectuat redirectarea permanentă 301)

2. Link-uri în JavaScript. Au fost testate diferite tipuri de link-uri, în diferite coduri JavaScript:

Link-urile din meniurile dropdown sunt integral crawl-ate (citite) și indexate de roboții Google;
– funcții configurate în afara tag-ului href Attribute-Value Pair (AVP), în tag-ul “onClick”;
– funcții JavaScript în tag-ul href AVP – “javascript:window.location“;
– funcții JavaScript configurate în afara tag-ului < a >, în href AVP “javascript:openlink()”.

Link-urile vizibile/generate la mișcarea cursorului (mouse); URL-uri cu diferite variabile care se execută în funcție de anumite specificații (onmousedown și onmouseout) și link-uri concatenate.

Rezultatul testului: link-urile sunt integral crawl-ate (citite) și indexate de roboții Google;

3. Conținut integrat dinamic: text, imagini, link-uri și elemente de navigare.

Teste efectuate:
– conținut integrat dinamic în cod HTML, în codul sursă al paginii web;
– conținut integrat dynamic, în afara codului HTML, în codul sursă al paginii web – în fișere externe de tip JavaScript.

Rezultatul testului: în ambele cazuri, conținutul generat dinamic a fost integral crawl-at și indexat de roboții Google, iar paginile web au avut un ranking bun în paginile de rezultate generate la căutarile pe Google.

Mai mult, a fost realizată și testată și varianta întregii navigări într-un site în cod JavaScript, cu toate link-urile integrate cu funcția “document.writeIn”. Toate aceste link-uri au fost craw-late și indexate complet de roboți.

De aceea este important să nu fie blocate la indexare sursele de tip CSS și JavaScript în fișiere Robots.txt, pentru că acest lucru are un impact negativ asupra întregului site. Aceste recomandări sunt precizate și în Ghidul de Calitate Google: https://support.google.com/webmasters/answer/35769?hl=en

4. Meta Date, tag-uri integrate dinamic

Testul efectuat de specialiștii Searchengineland.com a inclus și Meta Tag-uri generate dinamic, integrate în DOM (ce este DOM – explicații la sfârșitul articolului), dar și diferite alte tag-uri foarte importante din punct de vedere SEO:
– Meta Title și Meta Description;
– Meta robots, tag-ul Canonical.

Rezultatul testului: în toate cazurile, aceste tag-uri dinamice au fost crawl-ate și indexate de roboții Google, la fel ca și tag-urile similare de tip HTML, din codul sursă al paginilor web.

5. Tag-ul rel=”nofollow”

Un alt test a avut ca obiect tag-ul rel=”nofollow” pe care îl folosim pentru link-uri pe care nu vrem ca roboții de indexare să le urmeze și să le ia în calcul în procesul de rankig.

sursă foto Searchengineland.com

Rezultatul testului:
Testul a arătat că în cazul link-urilor integrate în cod HTML cu acest tag, roboții nu au luat în calcul aceste link-uri, practic nu au urmat calea indicate de ele, datorită acestui tag rel=”nofollow”.

În cazul link-urilor integrate în DOM JavaScript roboții au indexat link-urile, deși aveau atribuit tag-ul rel=”nofollow”. Acest lucru este posibil pentru că roboții Google au accesează link-urile și le indexează, înainte să se execute funcția JavaScript care atribuie tag-ul rel = “nofollow”.

Concluzii și puțină istorie SEO

Pe măsură ce au apărut și au câștigat popularitate, motoarele de căutare, așa cum le știm astăzi, s-a dezvoltat și industria SEO, care avea ca recomandare esențială, realizarea de pagini statice și integrarea conținutului în HTML (text, imagini, link-uri, tag-uri) în codul sursă. Codul HTML este indexat rapid, ușor de controlat și de implementat, însă, odată cu evoluția tehnologiei, și mai ales odată cu dezvoltarea comerțului online, codul HTML nu mai este optim pentru toate tipurile de site-uri.

Testele realizate și explicate de specialiștii Searchengineland.com arată că Google a ținut pasul cu tehnologia și cu nevoia dezvoltării de site-uri web complexe. Și-a adaptat sistemele de crawl-are și indexare și algoritmii de ranking, astfel încât să poată fi apreciate corect soluții web de tip HTML5, JavaScript și site-urile dinamice.

DOM – Document Object Model
DOM este un program (API) pentru realizarea de documente / conținut web, pe principii de structură și funcționalitate. Exemplul de mai jos reprezintă structura unui tabel în format HTML:


DOM reprezinta legătura dintre paginile web (așa cum le vedem noi) și componentele de programare. Astfel, se încarcă un cod HTML, se excută funcții JavaScript, iar rezultatul obținut este acest DOM – o structură model.

Detalii: https://www.w3.org/TR/DOM-Level-2-Core/introduction.html

(sursă imagine www.w3.org)