Hvordan identificerer jeg identisk indhold på mit website?
Der findes desværre ingen måde, hvor du med sikkerhed kan identificere identisk indhold på tværs af hele dit website. Men du kan teste bestemte sektioner og sider på dit website med nedenstående metode og derigennem få en god fornemmelse af, hvor slemt det står til, og hvad problemerne skyldes.
Lad os kigge lidt nærmere på Amino.dk, som jeg tidligere her i bogen har identificeret nogle problemer på, der måske skyldes duplicate content.
Jeg har fundet en debattråd frem, som kun strækker sig over en side (mindre end 10 indlæg). På den måde undgår vi i første omgang at blande to forskellige problemer sammen: Identisk indhold – eller identiske TITLEs.
Jeg søger så på en kombination af en ’site:’-søgning på amino.dk og titlen på den udvalgte debattråd:
- site:amino.dk “Datterselskab værdi osv.”
Det giver følgende resultat:
Som du kan se er der kommet nogle sider med, som ikke er fra den tråd, der har denne overskrift. Disse er andre sider der linker til den med sidens TITLE.
For at undgå dette kan vi tilpasse vores søgning lidt. I stedet for bare at søge på de ord der er i TITLE kan vi vælge kun at se sider, hvor de netop optræder i TITLE og ingen andre steder. Det gøres på denne måde:
- site:amino.dk intitle:”Datterselskab værdi osv.”
Det giver følgende resultat:
Som du kan se, viser Google kun en side, men skriver samtidig at de har fundet flere, som de mener i meget høj grad ligner denne. Ved at klikke på linket, kan vi se, hvad der gemmer sig der.
Ahh, nu sker der noget! Som du kan se, har Google fundet intet mindre end 10 forskellige URL’er, som faktisk peger på nøjagtigt den samme side. Nedenfor har jeg listet dem alle. Hvis du klikker dig ind på hver enkel af dem, kan du se, at det faktisk er den helt samme side, bare med forskellige URL’er. Altså 100% duplicate content.
- http://www.amino.dk/forums/p/684/7560.aspx
- http://www.amino.dk/forums/t/684.aspx
- http://www.amino.dk/forums/p/684/7564.aspx
- http://www.amino.dk/forums/ThreadNavigation.aspx?PostID=216&NavType=Previous
- http://www.amino.dk/forums/p/684/7563.aspx
- http://www.amino.dk/forums/p/684/7561.aspx
- http://www.amino.dk/forums/p/684/7562.aspx
- http://www.amino.dk/forums/p/684/7558.aspx
- http://www.amino.dk/forums/p/684/7559.aspx
- http://www.amino.dk/forums/ThreadNavigation.aspx?PostID=3075&NavType=Next
Årsagen til det konkrete problem på Amino.dk ligger i det publiceringssoftware, de anvender. Leverandøren har ganske enkelt ikke haft fokus på at undgå denne type af problemer. Det er efter min mening for dårligt! Særligt set i lyset af, at de gennem flere år er blevet gjort opmærksom på det.
Skriv en kommentar