Dzisiaj Zgred na swoim blogu napisał kilkanaście porad i uwag związanych ze stosowaniem rel=”canonical”, jako że jakieś errory wystąpiły na jego stronie podczas dodawania komentarza, przez co nie mogłem dopisać paru zdań, postanowiłem opisać trzy największe zagrożenia płynące z niezastosowania tagu kanonicznego na stronie. Poznaj szczegóły – przeczytaj cały artykuł.
Pierwsze zagrożenie – kradzież treści
Można zabezpieczyć się przed konsekwencjami płynącymi z kradzieży treści poprzez wskazanie oryginalnego dokumentu przy pomocy tagu kanonicznego. Rel canonical to jedna z metod wskazywania autorstwa. Dzięki wdrożeniu tagu można zapobiec sytuacji, gdzie skopiowana podstrona pojawia się wyżej w SERP aniżeli oryginalna. Jeśli robot wpierw odnajdzie tekst na stronie X z canonicalem, potraktuje ją jako źródło treści, co najśmieszniejsze, z testów które robiłem w marcu 2013 data zaindeksowania strony w ogóle nie była brana pod uwagę, przy ustalaniu dokumentu źródłowego. Jeśli treść skopiowaliśmy na inny blog – strona powielona była wyświetlana wyżej w wynikach wyszukiwania. Nie było to normą, ale widać było zależność braku canonical a wyższą pozycją duplikatu w wynikach wyszukiwania.
Nie ma co ukrywać, że przy ustalaniu autorstwa bardziej pewnym zabiegiem jest zintegrowanie autora z profilem na Google+, to jednak canonical też zalicza się do metody „przypisywania autorstwa” i wraz z innymi metodami powinien być stosowany do zabezpieczenia strony.
Drugie – celowe duplikowanie treści na stronie
Witryna bez rel canonical jest bardziej podatna na celowe generowanie duplikatów w witrynie – dot. to przede wszystkim sklepów internetowych, gdzie sam skrypt pozwala na bardzo łatwe generowanie duplikatów. W dobie kar algorytmicznych za niskiej jakości podstrony w sklepach, stosowanie canonical do zabezpieczenia jest na czasie.
Trzecie – kradzież PageRank
Strony bez canonicala są bardzo podatne na typ ataku zwany pagerank steal i nie mówię tutaj o przekierowaniach do uzyskania Fake PageRank ale o procederze kradzieży żywego PageRank ze strony z wysokim autorytetem. W zasadzie to nie do kradzieży, ale do pożyczenia sobie PageRanku strony docelowej – z tego co widziałem stronie docelowej nie ubywało PR, ale kopia zyskiwała wysoki PR strony matki. Z moich obserwacji wynika, że ofiarami najczęściej padały strony, które nie posiadały tagu kanonicznego. Nie wiem czy to jakiś bug jest, czy „coś” innego, ale śmiesznie wygląda jak domena z zerowym trustem (według Seomastering TrustRank Checkera) miała PR4.
Podsumowując, Zgred jak zwykle przekazał sporo wiedzy w swoim artykule, ale niestety wszystkiego nie napisał – mówię o zagrożeniach płynących z niestosowania rel canonical.
Oczywiście w tej kwestii pewnie będą różnice zdań.
To co akurat wymieniłeś to jest pikuś przy tym jak można skorzystać z canonical’a do niszczenia konkurencji – szczególnie gdy skrypt „wroga” jest dziurawy…. Nie mniej jednak zawsze lepiej to wdrożyć 🙂
A co począć jak ktoś skopiuje treść i też sobie pierdyknie canonical? Jakoś to dla mnie nieczytelne jest.
A czy wprowadzenie rel next prev zabezpieczy moją stronę?
Jak można przed tym obronić się? Profilaktyka jest możliwa? Jeśli tak jak to zrobić?
@zeki, to wtedy nic ta druga osoba nie ugra. Jeśli strona oryginalna ma canonical i bot indeksując stronę wychwyci tę kwestię, pojawienie się tej samej treści na innych stronach nic nie da, kopia nawet jak przywalisz linkami a znajdzie się w suplementalu to i tak oryginał będzie wyświetlany wyżej aniżeli skopiowana treść. Przetestowane w praktyce. Jak testowałeś w praktyce i masz inne wnioski to proszę pochwal się nimi, chętnie zapoznam się z Twoim punktem widzenia. A nuż może coś ciekawego z tego urodzi się.
@Zigert, rel prev next stosowane jest głównie w paginacji do określenia relacji między danymi podstronami w serwisie. Ma powiedzieć googlebotowi, że ten zlepek podstron stanowi logiczną całość.
Taką działalność można zidentyfikować i podjąć odpowiednie kroki korzystając z serwisów do monitorowania wyników wyszukiwania np. Google Alerts => https://techformator.pl/google-alerts-marketing/
choć akurat GA nie jest najciekawszym rozwiązaniem, żeby mieć raporty na bieżąco i móc zareagować bardzo szybko trzeba skorzystać z zewnętrznych systemów monitorowania – oczywiście płatnych, darmowych oprócz GA nie znam.
Dodajesz wybrane części treści artykułu do monitorowania, określasz warunki i częstotliwość otrzymywania raportów i jeśli dany artykuł zostanie skopiowany, na wyjściu otrzymasz powiadomienie z informacją, kiedy i gdzie ktoś ukradł Ci treść z serwisu. Duże firmy takie rozwiązania stosują, bo wiedzę że unikalna treść to użytkownicy. Pomyśl sobie tylko, user użytkuje jakieś forum, na którym publikowane są przedruki newsów bez linków zwrotnych do macierzystych serwisów. Myślisz że taki user będzie miał ochotę szukać źródła? Przeczyta i już. Na serwis docelowy nawet nie przejdzie.
Koszty monitorowania są bardzo wysokie, dlatego tylko największe portale mogą sobie na takie rozwiązanie pozwolić. Taniej wyjdzie nawet własny system (skrypt) do monitorowania aniżeli korzystanie z usług zewnętrznych usługodawców.
Mariusz ja nie mam punktu widzenia i stąd pytanie moje. Co się stanie jeśli ja mam canonical i ten co skopiował też ma canonical. A nie daj Boże robot jemu pierwszemu zaindeksował treść.
Myślę, że tu będzie brane pod uwagę Zeki kto pierwszy sobie to wstawi data może będzie tu odpowiedzialna, choć nie jestem pewny. Nasze strony zawsze będą podatne na przeróżne ataki tak jak i te wspomniane w tym artykule. Przykre jest to, że ktoś się napracuję na stornie czy na blogu a ktoś żywcem karmi się czymś doświadczeniem na nie korzyść właściciela. Ale ciekawe jest to że jak skorzysta jeden i drugi z polecenia canonical i co wtedy ?
@Damian, napisałem już, nic się nie stanie. Pierwszy canonical zostanie uznany za wersję nadrzędną.
@zeki: tak problemem będzie czyja strona będzie prędzej zaindeksowana przez Google oraz czyja strona będzie miała większy autorytet.
1. Tak naprawdę przy kradzieży treści sam rel=canonical nas nie uchroni. Każdy przecież może sobie taki znacznik wstawić. Oczywiście należy pamiętać iż nie zawsze jest to kradzież. Posłużę się przykładem z działalności naszego sklepu internetowego. Idealnym przykładem duplikowania treści będą tutaj porównywarki cen współpracujące ze sklepami. Efekt tego jest taki że często w SERPach podstrony produktowe z porównywarek są wyżej niż podstrony sklepu, pomimo posiadania podobnej treści. Dlaczego? Przede wszystkim większy autorytet domeny. Kolejność indeksowania jest tutaj w porządku: najpierw sklep, potem porównywarka. Oczywiście można również domniemywać że porównywarki mają tak wymiksowane treści na swoich stronach że dodatkowo Google nie rozpoznaje tego jako duplikat.
2. Rel=canonical idealnie się sprawdzi w obrębie naszej własnej witryny. Większość stron czy skryptów umożliwia przecież doklejenie dowolnej ilości parametrów w adresie. W ten sposób możemy utworzyć (świadomie lub nie) ogromną ilość duplikatów podstron, różniących się adresem. Bez tagu rel=canonical będziemy po pierwsze narażeni na duplicate content, który sami sobie zafundujemy a po drugie będziemy narażeni na to że miła konkurencja się tym zainteresuje i spowoduje zaindeksowanie jakiejś porcji podstron o identycznej lub podobnej treści, co jak wiadomo nie pozostanie bez echa dla Google.
3. Znacznik canonical jest idealny dla „legalnej” współpracy i wymiany treści. Przykładem jest kupowanie artykułów lub wymiana wpisów na blogach. Wówczas rel=canonical doskonale poinformuje wujka Google o tym skąd pochodzi oryginał tekstu. Jest to również kwestia uczciwości autorów względem siebie.