Sidans brödtext
En video-introduktion till Landningsidans brödtext med Caroline Danielsson
Texten på din sajt är dess innehåll i Googles ögon. Det är texten som är sajten. Det är kanske inte etthundra procent sant längre, sökmotorer har blivit något bättre på att tolka och förstå annat innehåll också men fortfarande långt ifrån så bra som de kan tolka text.
Text är ofta ett område där sajter idag brister. Många publiceringssytem hanterar många av de tekniska detaljerna tillräckligt bra för att kunna ta åtminstone några positioner. När det gäller text däremot är det upp till dig och det är nästan alltid något väldigt tidskrävande. När sökmotorerna var yngre än de är idag var mängden text en viktig faktor i hur väl en sida placerade sig i resultaten. Fler antal sidor var också viktigt för det innebar större möjligheter att placera sig på fler sökord. Konstigt nog har det en stark korrelation med position idag också. Mer verkar vara bättre, med några undantag.
Vi har gjort en lång rad tester med att helt enkelt öka mängden innehåll på en specifik sida och efteråt kunnat mäta att den klättrat i resultaten. Den sida som klättrat snabbast de senaste sex månaderna i sökresultatet för Sökmotoroptimering, soekmotoroptimering.se som drivs av Håkan Persson, har i skrivande stund inte mindre än 5.553 ord på den sida som håller en position. Det är inte en slump att han valt att ha en sådan mängd text på sidan.
Text är förstås inte bara text. De ord som brukar användas om en bra text för sökmotorer är relevant och fyllig. Att bara rabbla en massa ord eller fylla ut med nonsenstext är något som faktiskt aktivt kan skada din sökmtoroptimering. Det du ska eftersträva är text som är fullproppad med bra information för dina besökare, som är relevant för de sökord som du vill synas på. Det innebär bland annat att du behöver nämna det exakta sökordet som det är tänkt att sidan ska synas på men du ska inte proppa texten för full.
Det generella rådet vi brukar ge är att skriva en text som är så bra som möjligt för användaren och innehåller så mycket information som möjligt. Fyll väldigt gärna på med mer text alltså men fyll inte på med intetsägande text. Se till att den text du lägger till tillför ett värde.
Google pratar gärna själva om hur bra de är på att förstå text och visst är det så att sökmotorn känner igen en hel del synonymer och kan sätta en del texter i ett sammanhang. De är långt ifrån att faktiskt förstå texten däremot. Därför behöver du vara tydlig med vilket sökord sidan ska synas på. Det räcker inte med att antyda sökordet, du behöver säga det rakt ut. Är det tänkt att sidan ska synas på Riktigt bra skruvar så behöver det stå Riktigt bra skruvar i texten. Det skadar definitivt inte att det också finns Finfina skruvar och Riktigt bra bultar i texten, det viktiga är att huvudsökordet inte glöms bort.
En annan viktig aspekt är att sökmotorer har svårt att acceptera att en sida kan handla om fler än en sak. Vi har redan snuddat vid det i avsnittet om landningssidor men det är viktigt så ett förtydligande kan vara på sin plats. För maximal effekt behöver varje sida handla om endast en sak. Här blir det ofta en fråga om gränsdragning.
Förr var det så att Google inte klarade av att hantera att plural och singular egentligen var samma ord. Bäst var alltså att ha en sida för Nötter och en för Nöt om man ville hålla bra positioner på båda. Det samma gällde för ordföljd, spel online och online spel såg helt olika ut i Googles ögon. Nu är det här något bättre och vår vanliga rekommendation är att inte separera sådant till olika sidor utan att i så stor utsträckning som möjligt ranka med samma sida för Nöt och Nötter. Det fungerar inte alltid men är en bra utgångspunkt, en annan aspekt som behöver tas hänsyn till här är Panda, mer om det senare.
Om vi återanvänder exemplet från avsnittet om landningssidor. Vi har tre olika sidor, en om cyklar, en om mountainbikes och en om Scott Spark 900 SL (som är en mountainbike). Det här är en någorlunda rimlig och vanlig uppdelning i en webbshop. Startsidan ska synas på sökorden Cykel och Cyklar, en kategorisida på sökorden Mountainbike och Mountainbikes. I botten av hierarkin hittar vi produktsidorna som ska synas på respektive produkts namn och eventuella varianter av dessa, i det här fallet Scott Spark 900 SL.
Det kan vara komplext att få en bra förståelse för hur den egentliga uppdelningen ser ut när det kommer till brödtexten. Första sidan ska alltså handla om cyklar. Den ska inte handla om mountainbikes eller om Scott Spark 900 SL. Det är däremot inte konstigt att den tar upp olika typer av cyklar, däribland mountainbikes. För att göra det tydligt tar vi några exempel på saker man kan avhandla i texten:
- Olika typer av cyklar som finns
- Att tänka på när man köper cykel
- Cykelns historia
- Vad som skiljer våra cyklar från andra
Vad skiljer då denna sida om cyklar från den om mountainbikes? Det går att kalla det hårklyverier men att helt enkelt byta ut cykel mot mountainbike i ämnena gör att det blir en mountainbikesida.
- Olika typer av mountainbikes som finns
- Att tänka på när man köper mountainbike
- Mountainbikens historia
- Vad som skiljer våra mountainbikes från andra
Det här kommer generera helt andra texter, det är inte exakt samma saker man ska tänka på när man köper mountainbike som när man köper en generisk cykel. Mountainbiken har en helt annan historia än cykeln och så vidare. Det är inte konstigt att mountainbike nämns på cykelsidan eller att cyklar nämns på mountainbikesidan. Det viktiga är att texten handlar om det man vill att sidan ska synas på. Målsättningen ska vara en bra och naturlig text som handlar om just det ämnet.
På produktsidan finns det några saker som är värda att tänka på. En produktsida innehåller oftast text som kommer med en speciell typ innehåll. Det handlar ofta om en beskrivande text av produkten, produktdata och pris. Många E-handlare väljer att hämta den här informationen från leverantören och när det gäller produktdata är det inte så mycket att göra åt, den väger det den väger. Gällande brödtexten däremot är det här något som ska undvikas och vi ska strax återkomma till varför.
Särskilt för E-handlare är produktsidor, eller sidorna längst ner i sajtens hierarki det som skapar problem när det gäller text. För någon som säljer 10.000 produkter är det inte så roligt att sitta och skriva 10.000 texter. Särskilt inte med riktlinjen, ju fylligare och mer desto bättre. Det är lätt att inse att det här är ett oerhört jobb. Fördelarna med att genomföra det är stora men som alltid behöver du väga fördelarna mot nackdelarna. I de butiker på nätet jag själv äger väljer vi att till att börja med publicera produkter med leverantörernas texter för att sedan skriva om dem över tid. Det tar tid men vi upplever att det är värt att göra.
För att återkomma till varför det är dåligt att använda leverantörernas text. Anledningen är enkel, din text behöver vara unik för att Google ska tillskriva den ett värde. Ingen sökmotor vill egentligen visa upp flera versioner av samma text i ett sökresultat. Därför har man algoritmiskt försäkrat sig om att det inte ska ske. Kopior av texter lider alltså extra i sökresultaten. Det kallas på Google-språk för Duplicate Content. Duplicate Content filtreras och sökmotorn försöker hitta originalkällan och endast visa den.
Det har under året gett lite lustiga resultat för Googles egen Grundhandbok om sökmotoroptimering som studsat rejält i sökresutlaten. Den håller oftast en riktigt bra position på viktiga sökord inom sökmotoroptimering men under perioder har någon av många kopior på den istället hållit dess position. Google har, på grund av att Duplicate Content-algoritmen är långt från perfekt, periodvis tappat bort sin egen version av texten och då valt att visa någon annans kopia av den.
Det finns alltså goda anledningar att förvissa sig om att den text du har på din sajt är unik. Faktiskt räcker det inte ens med att du inte kopierat den, det är också viktigt att ingen kopierar din text, som fallet med Googles grundhandbok kan visa.
En vanlig fråga som dyker upp då folk hör talas om Duplicate Content första gången är hur många ord som behöver bytas för att texten ska räknas som unik. Det är kanske både en tröst och en plåga att Duplicate Content inte är binärt, det är inte på eller av. Textens unikitet är en skala. Du kan inte byta ut 10% av orden och så börjar Google helt plötsligt anse att texten är unik. Om du byter 10% av orden kommer Google anse att texten är 10% unik. Det innebär bland annat att det inte är någon fara att till exempel citera någon men det innebär också att du inte bara kan göra sök och ersätt på en text för att få den att fungera optimalt. Texten på alla dina sidor behöver vara unik, det är ofta ett stort jobb men om du vill bygga optimalt så är det vad som behöver göras.
Det finns rågivare inom sökmotoroptimering som menat att man varje gång man vill nämna produkten eller tjänsten som landningssidan handlar om måste göra det med det exakta sökkordet. Det är helt enkelt inte sant. Google blir bättre och bättre på att hantera synonymer och förstå i vilket sammanhang en text finns. Att använda synonymer, pluralformen och närliggande ord är snarare något som stärker sidan. Det är viktigt att sökordet nämns men det skadar alls inte att också använda ord i samma “ordmoln”.
Det finns en teori om att Google använder Latent Dirichlet allocation, en modell som kan berätta om det finns likheter mellan två texter. Genom att använda sig av en sådan eller liknande algoritm kan man, i teorin, se skillnad på en artikel om filmen Iron Man och tävlingen Iron Man. Man jämför och grupperar helt enkelt informationen med annan information i ordmolnet.
Det finns idag inga bevis för att Google skulle använda sig av en sådan algoritm men en kvalificerad gissning säger att något liknande finns i spel. Synonymer och att sätta sin text i ett sammanhang verkar ge goda resultat.
Källor:
- http://static.googleusercontent.com/media/www.google.se/sv/se/intl/sv/webmasters/docs/search-engine-optimization-starter-guide-sv.pdf
- https://support.google.com/webmasters/answer/66359?hl=en
- http://moz.com/blog/lda-and-googles-rankings-well-correlated
- http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation