Under flera år har den varit på vift, Googles PDF om sökmotoroptimering. Nu verkar de ha, åtminstone för tillfället, hittat den igen.
Googles försvinnande PDF har varit en god läxa i en av de mindre kända egenskaperna av Googles algoritm och en oerhört tydlig förklaring till vilka problem man kan få med duplicerat innehåll. Dessutom har det varit till en del förtret för alla oss som arbetar med att synas på just sökmotoroptimering. Vi ska titta på det idag men först ska vi gå igenom vad som faktiskt har hänt:
Google skapade 2011 en PDF på ett stort antal språk. På svenska kom den att heta Grundhandbok om sökmotoroptimering. Man kan tycka att det är extra ironiskt med tanke på hur illa skött sökmotoroptimeringen kring grundhandboken varit men PDF:en var relativt bra innehåll och den fick en del länkar, både i Sverige och utomlands. I kombination med att det var väldigt mycket innehåll så började den ranka bra på sökord som Sökmotoroptimering.
Klåpare som de är borta i Mountain View (jag skämtar lite här, det sitter en hel del riktigt smarta typer där) så har de förstås inte optimerat sin egen sajt särskilt väl, alltså inte ens så att det går ok att spindla den för Google. Av den anledningen “tappades” guiden bort. I princip sedan den lyckades ta sig in i sökresultatet har kopior av PDF:en på andra domäner visats istället för originalet.
Det har handlat om att allt från skojfriska typer till mindre nogräknade SEO-byråer som helt enkelt publicerat en kopia av Googles material (jag förstår att enskilda bloggare kan få för sig att göra det men om du driver ett företag som jobbar med, mot eller nära Google så skulle jag nog akta mig för copyright-överträdelser). När Google senare inte lyckats bedöma att deras egen version var originalet, har helt plötsligt andra börjat synas på den plats de höll. Vem det varit har varierat över tid.
Vad kan vi lära oss av det här
Det är en känd funktion som agerar här. Google har metoder för att ranka vad de tror är originalet av en text och det är vad som ger den här effekten. Eftersom de inte mäter publiceringsdatum eller liknande (det skulle vara allt för vanskligt) så kan det bli lite vad som helst som kan räknas som original, särskilt om ursprungstexten är svårindexerad.
När Google sedan fått för sig att det är någon annans PDF som är källan så tillräknar de auktoriteten från de andra till den sidan. Man sammanfogar förtroendet som sidan fått, varför helt okända SEO-sajter och bloggare kunnat flyga in på topp 10 med hjälp enbart av att publicera Googles PDF.
Nu har det ju visserligen varit PDF:en som synts så jag har svårt att tänka mig att någon haft särskilt mycket nytta av den utom ett SEO-företag i södra Sverige som valde att “cloaka” det vill säga visa ett innehåll för Google och ett för besökare. Man skickade helt enkelt besökarna till sin egen sajt medan spindlarna fick läsa PDF.
Fundera på
Jag tycker att man kan fundera på exakt hur dåligt den här PDF:en har fungerat i sökresultaten. Det säger en del om de SEO-råd man får från Google. Om det räcker med att skapa en bra tjänst för att Google ska visa den (som de så gärna vill säga), då kan de ju inte själva ha en så bra tjänst?