Blogg & Insikter

Hur du skapar sitemaps

Sitemaps har funnits sedan urminnes tider, känns det som. De är en viktig del i ditt SEO-arbete och har flera fördelar, såvida de är korrekt byggda. Med hjälp av en sitemap kan du förenkla för Googlebot och påskynda indexering. I den här artikeln kommer vi att hjälpa dig förstå vikten av sitemaps och hur du skapar dem.

På svenska kallas de ibland för webbplatskartor, men inom SEO är det vanligare att använda det engelska namnet, sitemaps. Därför kommer vi att använda “sitemaps” i den här artikeln.

Olika typer av sitemaps – XML och HTML

Först ska vi förklara att det vi pratar om är XML-sitemaps. Det finns även sitemaps i HTML som ligger direkt på sajten. En HTML-sitemap är en sida där sajtens alla länkar ligger samlade och används av besökare. En XML-sitemap ligger dold och är bara ämnad för sökmotorer och kan se ungefär så här:

<urlset xmlns=”http://www.minsida.com”>
<url>
<loc>

</loc>
</url>
<url>
<loc>

</loc>
</url>
<url>
<loc>

</loc>
</url>
</urlset>

Kortfattat är en XML-sitemap en fil i XML-format där du listar de sidor på sajten som du vill ska indexeras och som du anser är viktiga. När Googlebot söker igenom eller “spindlar” din sajt och hittar en sitemap, kan den spindla mycket effektivare. Den ser vilka sidor du vill ska indexeras och som du tycker är viktigast. Eftersom en sitemap bara är en lång lista behöver den inte söka genom internlänkar från nivå 1 och nedåt som den gör på själva sajten.

Varje spindling har bara en mängd länkar allokerad till sig innan Googlebot går vidare till nästa sajt, en så kallad spindlingsbudget/crawlbudget. Om du har en stor sajt med tusentals länkar kanske inte hela sajten söks igenom innan Googlebot går vidare, därmed kanske den missar det senaste innehållet som du arbetat så hårt att skapa.

Hur du skapar en sitemap

Bestäm först vilka sidor som ska vara med. Här ska du exkludera sidor som du behöver men som du inte vill ska ranka i de organiska sökresultatet. Det kan vara inloggningssidor, varukorgen, duplicerat innehåll som behövs men inte ska ranka och liknande. Exkludera även 404:or och sidor blockerade av robots.txt.

En sitemap har vissa restriktioner:

  • Den får inte innehålla fler än 50 000 URL:er
  • Filstorleken får inte vara större än 50 MB (okomprimerad)

Om din sitemap överstiger någon av dessa krav kan du dela upp din sitemap i flera olika. Tänk då på att dela upp den smart, exempelvis en sitemap för produkter och en för kategorier. Dock är det sällan som en sajt är så pass stor men om du behöver göra det måste dina sitemaps ha unika namn, annars kanske de framstår som duplicerade.

Det finns flera gratisverktyg du kan använda för skapa en sitemap eller så kan du skapa den själv. Använder du WordPress finns det exempelvis plug-in som Yoast som kan hantera sitemaps åt dig. Vi rekommenderar att du hittar ett verktyg du litar på som genererar en fil åt dig. Vill du skapa en själv från grunden behöver du kunna HTML-kodning. Du kan skapa det i exempel Anteckningar/Notepad och sedan göra om det till en XML-fil men frågan är om det är värt besväret när det finns gratisprogram att använda?

Några saker att tänka på om du väljer att skapa din sitemap själv:

  • Google spindlar URL:erna precis som de står nedskrivna. Använd alltså samma typ av URL:er, med det menar vi att du ska:
  • Se till att du listar de kanoniska URL:erna.
  • Alla URL:er ska vara antingen HTTP eller HTTPS beroende på vilken du använder, endast en variant.
  • Alla URL:er ska vara skrivna med eller utan www, blanda inte!
  • En sitemap måste vara i HTML UTF-8
  • En sitemap kan bara innehålla ASCII-karaktärer
  • Om du har en URL för mobil och en för desktop, använda bara en av dem.

Om din sajt finns på flera språk kan du lägga till dessa med en <xhtml:link> tagg i din sitemap. Exempel hur det ser ut nedan:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:xhtml=”http://www.w3.org/1999/xhtml”>
<url>
<loc>http://www.minsida.com/en/index.html</loc>
<xhtml:link
rel=”alternate”
hreflang=”en”
href=”http://www.minsida.com/en/”
/>
<xhtml:link
rel=”alternate”
hreflang=”de”
href=”http://www.minsida.com/de/”
/>

Inkludera tagg för förändringar

Din sitemap-fil borde ha en så kallad Lastmod-tagg. Denna metadata kan Google läsa och se när de senaste förändringarna skedde. Om du nyligen skapat nytt innehåll kan Googlebot se att du nyligen ändrat nåt i sitemapen och därmed har större anledning att spindla igenom den. En sådan tagg kan alltså skynda på indexering och avindexering på din sajt. Du kan exempelvis inkludera URL:er med “noindex” i din sitemap. När Googlebot ser att din sitemap har förändrats är chansen större att den spindlar igenom den på nytt, hittar de URL:er som du har satt “noindex” på och avindexerar dem. Dessa “noindex”-sidor borde dock inte ligga uppe permanent. Tanken är att lägga till dem och sedan ta bort dem när de väl avindexerats.

En Lastmod-tagg ser ut så här:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.example.com/</loc>

<lastmod>2005-01-01</lastmod> (OBS! Endast detta datumformat är godkänt!)

</url>

</urlset>

När du laddar upp din sitemap

Nu har du förhoppningsvis skapat en perfekt sitemap för din sajt! Vad ska du göra med den här filen?

Jo, först ska du ladda upp den på sajten. Du lägger XML-filen i sajtens rotkatalog. Om din sitemap ligger i en underkatalog kommer Googlebot bara att spindla URL:er från den nivån och nedåt istället för hela domänen. Enligt Googles John Mueller i en äldre video kan Googlebot inte läsa URL:er ovanför underkatalogen utan endast URL:er på den katalogen och lägre nivåer.

Om din sitemap laddas upp i Google Search Console ska detta dock inte vara ett problem, men för att vara på den säkra sidan är det alltid bäst att lägga den i rotkatalogen.

På tal om Google Search Console, här ska du också ladda upp din sitemap oavsett var den ligger på sajten. Där får du också svar på om den är läsbar och korrekt. Annars kommer GSC att ge dig en varning. Du kan även skicka en förfrågan till Google om indexering efter du har laddat upp din sitemap, för att påskynda processen. Det är ingen garanti men du har åtminstone gjort din del för att få din nya sitemap indexerad.

Sedan kan du lägga till din sitemap i robots.txt, om du vill. Den skrivs in så här:

Sitemap: http://www.example.com/sitemap.xml

Har du flera sitemaps ska alla så klart laddas in i rotkatalog, Google Search Console och robots.txt. Därför är det viktigt att de har unika namn.

Kom ihåg att varje gång du ändrar din sajt behöver du uppdatera din sitemap. Har du gjort en egen behöver du alltså göra en ny och ladda upp på samma sätt som ovan. Har du ett plug-in eller liknande kan programmet i många fall sköta uppladdningen och uppdatering åt dig.

Caroline Danielsson

Senior SEO-specialist

Caroline är senior SEO-specialist på Örnsköldsvikskontoret och team leader för SEO-avdelningen

Caroline Danielssons profilsida

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *