Date Structurate: ce sunt, cum funcționează și cum le implementăm

1. Despre “semantic web” și date strucurate.

Semantica este o ramură a lingvisticii ce are ca obiect studiul sensurilor cuvintelor și al evoluției acestor sensuri. În particular, semantica studiază relația dintre semnificanți (cuvinte, sintagme, simboluri) și sensul sau înțelesul acestora. Astfel, “semantic web” este o „rețea web cu sens”.

Semantic web nu se referă la cuvinte cheie (keywords) și la backlink-uri, ci la relația dintre concepte sau lucruri. Ceea ce face căutarea semantică diferită de căutarea obișnuită este, în cazul motoarelor de căutare web, acel principiu al logicii care se aplică informațiilor din baza de date a motoarelor și face conexiuni între acestea.

Astfel, din organizarea și relaționarea corectă a datelor (informațiilor), roboții pot să extragă informații / sensuri, pe care să le afișeze la interogarea / căutarea utilizatorilor de internet, în motorul de căutare. Această organizare și relaționare a informației stă la baza conceptului date structurate.

2. De ce să folosim date structurate pe site-ul nostru.

Dacă facem referire la Google, știm cu toții că paginile de rezultate afișate la o căutare, au fost modificate de-a lungul vremii și au ajuns de la o listă simplă de link-uri, la pagini de rezultate care afișează, pe lângă obișnuita listă de link-uri către diferite pagini web, și informații concrete precum hărți și adrese, imagini sau video, dar și informații text exacte și complete, care uneori nu mai necesită accesarea unei pagini web.

Aceste informații sau module (widget-uri) numite caracteristici de căutare (search features) sunt de 2 tipuri:

– Content type features – conținut afișat sub formă de rezultate separate ale căutarii pe Google; poate fi sub formă de răspuns direct, grafice sau carusel de informații / articole;

– Enhancements of the search results – acestea pot fi componente ale rezultatelor din site, precum breadcrumbs sau sistemul de rating.

Studiile au dovedit că rezultatele de tip Enhancements afișate în paginile motorului de căutare au o rată de click (CTR) mai mare cu 30% față de rezultatele obișnuite, de tip listă de link-uri și text.

Rata de clic (CTR). Definiție https://support.google.com/adwords/answer/2615875?hl=ro

Un alt atu al datelor structurate este posibilitatea transferului sau preluării acestora de către alte site-uri sau de aplicații web. Astfel de exemple sunt evenimentele ce pot fi importate în calendarul din calculatorul sau telefonul utilizatorului, rezervarea de bilete la un film sau un concert etc.

Avantajul implementării sistemului de date structurate este astfel evident. Dacă Google înțelege informația din paginile site-ului, organizată și structurată corect, poate să afișeze în paginile de rezultate, astfel de widget-uri care vor aduce cu siguranță un plus de trafic calificat pe site.

3. Tipuri de date structurate: Schema.org, Microdata, Microformats, RDFa.

Există mai multe variante sau modalități de implementare a datelor structurate, iar preferințele webmasterilor sau ale programatorilor web sunt împărțite, când vine vorba de terminologia folosită: se vorbește despre RDF, RDFa, Microformats, Microdata, Schema.org.

Găsim aici câteva dintre ele:   https://developers.google.com/search/docs/guides/intro-structured-data

Principiul de bază al funcționării oricărui sistem de date structurate este același; 2 componente bine stabilite care fac sistemul să funcționeze:
1. vocabularul – cuvinte sau expresii și sensul / înțelesul acestora;
2. gramatica – un set de reguli privind utilizarea vocabului, astfel încât enunțurile (înșiruirile de cuvinte sau expresii) să aibă un sens.

Fiecare sistem de date structurate funcționează cu aceste 2 componente (vocabularul și gramatica sau formulele). Pot fi combinate aceste componente de la diferite sisteme de date structurate, cu excepția Microformat-elor, în funcție de informația pe care vrem să o prezentăm pe site și felul sau forma în care vrem să o prezentăm.

Vocabularies

– Schema.org
– DCMI
– FOAF
– Microformats

Grammars

– Microdata
– JSON-LD
– RDFa
– Microformats

Twitter și Facebook au propriile sisteme de date structurate Twitter Cards și Open Graph protocol, care nu sunt concepute pentru motoarele de căutare și pot să co-existe în codul site-ul cu alte sisteme de date structurate.

4. Ce tip de date structurate să alegem pentru site-ul nostru.

În articolul său How to Use Schema Markup for Better SEO, Yauhen Khutarniuk recomandă vocabularul Schema.org pentru sistemul de date structurate pe care să-l implementăm pe site-ul nostru (https://www.link-assistant.com/news/structured-data.html) .

Schema.org este un vocabular înțeles și interpretat corect de motoarele de căutare cele mai populare, precum Google, Bing și Yahoo sau Yandex.

În privința sistemului de reguli gramaticale, sunt 3 sisteme foarte cunoscute și folosite la acest moment:
– RDFa (Resource Description Framework in Attributes)
– Microdata
– JSON-LD (JSON for Linking Data)

RDFa și Microdata sunt foarte asemănătoare și ambele permit utilizarea liniilor de cod HTML.

Google recomandă sistemul de codare JSON-LD, dar roboții Google pot să parseze (să citească, să interpreteze și să indexeze) la fel de bine și codurile Microdata și RDFa.

Yauhen Khutarniuk ne recomandă în studiul său să folosim sistemul de date structurate Sсhema.org + JSON-LD.

5. Cum implementăm în site sistemul de date structurate.

Implementarea sistemului de date structurate în site se face în 4 pași, astfel:

1. Alegerea tipului de organizare a conținutului din sistemul Schema.org și realizarea unei liste de corespondențe între URL-ul paginilor din site și tipul de structură potrivit.

2. Crearea sistemului de date structurate și integrarea în site

Sistemul de date structurate personalizat pentru fiecare pagină din site se poate realiza cu ajutorul instrumentul Google Structured Data Markup Helper https://www.google.com/webmasters/markup-helper/?hl=en

Evidențiați elementele paginii și le atribuiți etichete de schemă. Puteți adăuga etichetele lipsă – doar faceți clic pe butonul “Adaugă etichete lipsă“. Faceți clic pe Creare HTML, când toate etichetele sunt atribuite.

Apoi trebuie să selectăm tipul de cod JSON-LD din meniu și să integrăm scriptul astfel generat în codul sursă al paginii web, în <head>sau <body>.

3. Verificarea sistemului de date structurate integrat în website

Testăm paginile ăn acre am integrat conținut structurat cu ajutorul Structured Data Testing Tool.
https://search.google.com/structured-data/testing-tool

Pentru ca Google să afișeze în paginile de rezultate conținutul organizat / structurat (rich snippets), acest conținut al paginii din website trebuie să fie crawl-at de roboți și indexat în noua formă structurată.  Există și posibilitatea ca Google să nu afișeze conținutul organizat / structurat (rich snippets) din diferite cauze, precum:

– conținutul structurat nu este reprezentativ pentru website sau nu este corect;
– sistemul de date structurate nu este înțeles și interpretat corect de roboți, chiar dacă instrumentul de verificare nu a identificat erori;
– conținutul structurat nu este accesibil / nu este afișat utilizatorilor site-ului.

Dacă sistemul de date structurate nu este implementat corect sau sunt ascunse în mod intenționat informații utilizatorilor, Google poate să penalizeze site-ul și să dez-indexeze din baza de date paginile web în cauză sau întreg site-ul. Erorile de indexare și mesajele privind penalizările aplicate de către Google le găsim în Webmaster Tools (Search Console).

Pentru ridicarea penalizării, se vor remedia neregulile semnalate și se va trimite apoi la Google solicitare de reconsiderare a penalizării.

4. Monitorizarea, verificarea funcționării și a indexării conținutului structurat

Verificarea permanentă a gradului de indexare a conținutului structurat din site trebuie să facă parte din monitorizarea permanentă a performanțelor site-ului cu instrumentele din Google Search Console.

————————————————
INFO pe scurt

Sistemul de date structurate este important pentru roboții Google, care vor putea să înțeleagă și să indexeze / să aprecieze corect conținutul unui site, mult mai ușor și mai rapid.

Search Gallery: modul în care datele structurate afișează sau generează rezultate în Google Search.
https://developers.google.com/search/docs/guides/search-gallery
https://developers.google.com/search/docs/data-types/article#logo-guidelines

Fiind interesat de indexarea corectă a site-urilor, și implicit de afișarea de rezultate cât mai relevante la căutările utilizatorilor, Google vine în ajutorul webmasterilor cu un instrument care să îi ajute pe webmasteri să impleneteze corect și să testeze sistemul de date structurate: https://search.google.com/structured-data/testing-tool


Introduction to Structured Data
https://developers.google.com/search/docs/guides/intro-structured-data

Introducing Rich Results & the Rich Results Testing Tool https://webmasters.googleblog.com/2017/12/rich-results-tester.html