Mi köze a HTML szerkezetének a SEO-hoz?
A Google egyik munkatársa, Gary Illyes, nemrégiben nagy port kavart az egyik megnyilvánulásával, miszerint a HTML szerkezete nem nagyon számít a SEO-ban. Később aztán a LinkedInen tisztázta, hogy a „nem nagyon számít” nem ugyanaz, mint az „egyáltalán nem számít”, de ekkorra már késő volt.
Szóval mi a helyzet?
Mi köze a HTML szerkezetének a SEO-hoz?
Ez egy komplikált kérdés. Amikor Illyes a HTML szerkezetéről beszélt, akkor valószínűleg azokról a dolgokra gondolt, amik az őrületbe tudják kergetni a seo szakembereket:
- A H1 címsorok száma
- A H címsorok sorrendje
- A „B” és „STRONG” HTML címkék közötti különbségek
- A táblázatok használata a CSS stílusokkal szemben
- Hol helyezkedik el a szöveg a forráskódban
Ezek olyan dolgok, amikről a seo szakmában szűntelenül folyik a vita, és habár némelyikük valóban fontos volt régebben, manapság már más a helyzet.
A konkrét kérdés megvitatása előtt azonban fontos, hogy szót ejtsünk néhány további dologról.
A HTML rendkívül fontos az akadálymentes használathoz
Az akadálymentesség nem közvetlen rangsorolási szempont, ezért itt nem merülünk el benne mélyen. Ha viszont webhelyedet kevesebb látogató tudja gördülékenyen használni, akkor kevésbé is lesz népszerű a kereső felhasználók között, ami ronthat a SEO teljesítményen.
A Google Kezdő SEO Útmutatója külön meg is említi a címsorok és akadálymentesség, illetve a SEO kapcsolatát:
„Ha címsoraidat sorban helyezed el, az fantasztikus a képernyő-felolvasók számára, de a Google Kereső szemszögéből nézve nem számít, ha nincsenek sorban. A web általánosságban helytelen HTML-ből áll, szóval a Google Kereső ritkán támaszkodhat a HTML specifikációban elrejtett szemantikus jelentésekre.
Nincs továbbá egy mágikus, ideális mennyiségű címsor, aminek egy oldalon szerepelnie kellene. Ha viszont úgy érzed, hogy túl sok, akkor valószínűleg az is.”
Mi a helyzet a HTML szerkezet többi elemével?
A baj az, hogy a legtöbben rosszul képzelik el a keresőmotorok működését. Sokan ugyan úgy gondolnak rájuk, mint a 90-es években, amikor ezek a rendszerek még lexikális keresést használtak. Ez azt jelenti, hogy az a találat jelent meg a legelső pozícióban, ami a legtöbbször tartalmazta a keresett kifejezést.
Ezek a keresőmotorok határozottabb súlyozással kezelték azokat az eseteket, amelyekben a keresett szó vastagabb betűkkel vagy egy H1, H2 stb. címsorban jelent meg.
A szemantikus keresésben a tartalmakat vektorokká alakítják, és a BERT, a RankBrain és más algoritmusok segítségével értelmezik mind a lekérdezések, mint a tartalmak jelentését. Mindez jóval összetettebb, mint szimplán megvizsgálni a szavak előfordulásait. Amikor az algoritmusok ilyen vektorokká alakítják a tartalmakat, azok HTML szerkezetének nagy része el is veszik.
Nem csak a vektorok fontos tényezők ebben a folyamatban, hanem a megjelenítés is. Mielőtt a keresőmotorok képesek voltak lefuttatni a JavaScriptet a DOM megvizsgálásához, a HTML-re kellett támaszkodniuk a tartalom értelmezéséhez. Ez már nagyon rég óta nem így van.
Ahogyan a keresőmotorok képesek kiválasztani a legjobb tartalomrészletet egy oldalról, úgy képesek azonosítani annak elsődleges címsorát, még akkor is, ha nem az nem H1 címkében szerepel.
Igen, a H1 egy jel az algoritmusok számára, de épp úgy jelnek számít a betűméret, az elem fő tartalomhoz viszonyított elhelyezése és az elemben olvasható szöveg is.
Régebben problémának számított, amikor valaki egy nagyobb betűmérettel ellátott SPAN címkében helyezte el az oldal elsődleges címsorát H1 helyett, míg manapság a keresőmotorok általában tudják, hogy egy hatalmas betűkkel szedett SPAN vélhetően annak tekinthető.
Ez persze nem azt jelenti, hogy nincs értelme H1, H2 és egyéb címsorokat használni a „helyes” hierarchiában. Egyfelől fontosak az akadálymentesség szemszögéből, másfelől azért a keresőmotorok is odafigyelnek még rájuk. Mindenkinek könnyebb dolga lesz webes tartalmaiddal, ha így teszel, de a keresőmotorok nem fognak megbüntetni érte, ha a HTML-ed szerkezete nem pont a könyv szerint készül el.
Szintén gyakori tévhit, hogy csak egy H1 címke szerepelhet az oldalakon.
A HTML5 bevezetése óta teljesen elfogadható (és bizonyos akadálymentességi helyzetekben kifejezetten szükséges is), hogy egy oldalon több H1-es címsor is szerepeljen. Ez nem fogja tönkretenni a SEO-dat (hacsak nem használod őket kulcsszóhalmozásra és nem állítod az összes címsort H1-re).
A keresőmotorok ugyanis (leegyszerűsítve) a következőt csinálják:
- Azonosítják a cím elemet és a legfontosabb címsorokat (ezek lehetnek H1, H2 stb., vagy egészen más HTML címkék is).
- Ez után lexikális és szemantikus algoritmusok segítségével megállapítják, hogy ezek mennyire relevánsok a lekérdezéshez, mielőtt továbbítják őket egy gépi tanulást használó algoritmusnak, illetve a rangsorolónak.
A lényeg az, hogy a keresőmotorokat általában már nem érdekli, hogy van-e H1, H2 címke a tartalmaidban, vagy hogy hány darab szerepel ezekből. Csak az a fontos számukra, hogy képesek legyenek azonosítani az oldal címét.
Ugyan ez a helyzet a félkövér betűtípusú, vagy SPAN, DIV címkékben szereplő tartalmakkal. Nem feltétlenül a címke típusa számít – a legtöbb algoritmust az érdekli, hogy a tartalom kapcsolódik-e a lekérdezéshez.
Akkor nem kell foglalkozni a HTML szerkezetével?
De igen, kell. A HTML szerkezete valójában tönkreteheti oldalaid SEO-ját, ha nem állítod össze megfelelően.
Ha például a BODY szakaszba helyezed a kanonikus címkét a HEAD helyett, akkor a keresőmotorok nem fogják figyelembe venni azt.
Hasonlóképpen, ha egy DIV-et helyezel a HEAD szakaszba, akkor a Googlebot azt feltételezi majd, hogy elfelejtetted bezárni a HEAD szakaszt, majd megnyitni a BODY-t, ezért megteszi ezt helyetted, így számos fontos SEO-val kapcsolatos címkéd kerülhet a BODY-ba, ahol teljesen hatástalanok lesznek.
Más HTML hibák is árthatnak a SEO-nak. Például, ha egy „onclick” JavaScript eseményfigyelővel ellátott SPAN címkét használsz href tulajdonsággal ellátott „A” címke helyett, akkor a keresőmotorok nem tekintik majd linknek, még akkor SEM, ha úgy viselkedik az elem a felhasználóknak. Ez az akadálymentességnek is árt, ezért nem érdemes így csinálni.
Gyakori kérdések
Mire utal a HTML szerkezete?
A HTML szerkezet a weboldalak HTML forráskódjának felépítését jelenti. A HTML szerkezetének bizonyos szabályoknak kell megfelelnie, hogy „érthetők” legyenek a böngészők és keresőmotorok számára.
Számít a HTML szerkezete a SEO-ban?
Egy hibás HTML szerkezet (pl., amelyben bizonyos elemek nem a megfelelő szakaszban helyezkednek el) SEO problémákhoz vezethet. Azonban a HTML szabványtól való kisebb eltérések (pl. H1, H2 címkék sorrendje és száma) nincs hatással a SEO-ra.