Copyscape i Siteliner - Narzędzia do analizy duplikacji treści

17 września 2019

W pierwszej części serii, którą przeczytasz pod tym linkiem,  poza wskazaniem podstawowych przyczyn powstawania kopii treści oraz sposobów jej eliminowania, przeczytasz także o rozróżnieniu zjawiska duplikacji na duplikację zewnętrzną oraz wewnętrzną. W części drugiej przyjrzymy się narzędziowej analizie stron pod kątem obu z nich. Role główne dla tego wpisu zajmują popularne narzędzia Copyscape oraz Siteliner. W tym wpisie dokonamy ich przeglądu, skupiając się na praktycznym omówieniu ich funkcji.

Kto kradnie moją treść?! – Analiza duplikacji zewnętrznej

Tworząc pierwszy wpis serii, wskazałem negatywny stosunek Google do zewnętrznych kopii treści. Sprawiedliwie byłoby, gdyby zawsze za duplikat karany był „pożyczający”. Praktyka pokazuje jednak, że osąd Google nie zawsze przychyli się w tym wypadku do rzeczywistego autora. Jeśli treści ukradł większy konkurent, portal lub Twoja treść trafiła do porównywarki cenowej, sankcje z tego tytułu mogą spaść na Twoją witrynę lub sklep internetowy.

Narzędzie Copyscape

Na szczęście, każdy właściciel strony internetowej może sprawdzić unikalność treści swojego serwisu, wykorzystując w tym celu popularne narzędzie do analizy duplikacji zewnętrznej - Copyscape. W prostych słowach, przeszukuje ono internet w poszukiwaniu odpowiadających sobie kopii tekstów. Co więcej, Copyscape wskazuje nie tylko linki do kopii, ale także zaznacza zduplikowane fragmenty (Dzięki temu nie jesteśmy zmuszani do ich samodzielnego określania lub do wymiany całego tekstu).

Czy to jest darmowe?

I tak, i nie. Copyscape oferuje swoją najważniejszą funkcję, czyli podstawową wyszukiwarkę duplikatów treści, za darmo, choć w ograniczonej liczbie zapytań na dobę. Jeśli posiadasz niewielką witrynę, liczącą kilka lub kilkanaście podstron, obędzie się bez żadnych kosztów (co najwyżej analizę trzeba będzie rozłożyć na kilka dni). Po wyczerpaniu dziennego limitu darmowych zapytań narzędzie przekaże nam stosowny komunikat i zaniecha weryfikacji adresu.

Komunikat wyczerpania limitu darmowych zapytań narzędzia Copyscape

 Jeśli chcesz przeanalizować większą witrynę, należy założyć konto i zasilić je odpowiednią kwotą. Podstrony rozwinięte o większą ilość treści będą kosztowały ponad 20 centów za jedno zapytanie. „Lżejsze” podstrony pochłoną odpowiednio mniejszą kwotę. Analiza duplikacji może okazać się budżetowym wyzwaniem w sytuacji, w której prowadzisz sklep internetowy, a to w nich najczęściej treść jest kradziona.

Główny interfejs

Copyscape oferuje prosty i przejrzysty interfejs. Główne okno nie pozwala na zagubienie się w dostępnych opcjach. Pozwala ono jedynie na wpisanie adresu URL, który chcemy analizować pod kątem duplikacji treści i kliknięcie przycisku „Go” w celu rozpoczęcia analizy:

Okno główne narzędzia Copyscape

W przypadku, w którym dla analizowanego adresu nie odnaleziono kopii, otrzymamy na ten temat stosowny komunikat:

Komunikat o braku wykrytych duplikatów


Jeżeli narzędzie znajdzie zewnętrzne odpowiedniki naszej treści, otrzymamy zawierającą je listę adresów URL oraz przykład skopiowanego fragmentu:

Okno rezultatów analizy duplikacji

Przykład skopiowanego fragmentu jest bardzo użyteczną właściwością Copyscape, która pozwala na szybkie ignorowanie duplikatów elementów stałych szablonu strony, takich jak np. modułu komentarzy (duplikat duplikatowi nierówny).

Klikając dowolny z wyników analizy, zostaniemy przeniesieni do okna prezentującego podstronę zawierającą kopię tekstu. Z informacji dowiemy się ile słów pokrywa się z treścią źródłową oraz jaki jest nieunikalny procent treści. Copyscape zakreśla też zduplikowane fragmenty. Jak widać na poniższym zrzucie, kopią okazał się jedynie element stały, którym nie powinniśmy się przejmować.

Wskazanie zduplikowanych fragmentów treści

Premium Search czyli Copyscape w wersji Premium

Po darmowej rejestracji konta, z poziomu menu nawigacyjnego możemy dostać się do zakładki „Premium Search” (Pamiętam, że za pierwszym razem minęło kilka minut, zanim odnalazłem się w nawigacji dla zarejestrowanych użytkowników):

Położenie Premium Search w menu nawigacyjnym Copyscape

Warto wspomnieć, że z poziomu okna Premium Search możemy podać nie tylko adres URL, ale także fragment treści do analizy. Istnieje jeszcze jedna drobna nowość… Narzędzie stale przypomina nam o kwocie pozostałej do wykorzystania.

Na co jeszcze warto zwrócić uwagę w Copyscape?

Copyscape oferuje także kilka innych funkcji, o których warto przynajmniej wspomnieć.

Batch Search

Ręczna analiza kilkuset podstron z pewnością nie należy do najciekawszych zajęć. Dlatego też Copyscape, z pomocą funkcji Batch Search, oferuje nam możliwość automatycznej analizy wskazanej listy adresów.

Okno Batch Search

Premium API

Czyli coś dla deweloperów – Copyscape umożliwia nam integrację Copyscape Premium z naszą witryną, co pozwoli na bieżącą analizę dodawanego contentu pod kątem unikalności.

Copysentry

Warta uwagi, ale także dodatkowo płatna, funkcja Copyscape, polegająca na systematycznej (cotygodniowej lub codziennej) analizie duplikacji treści wskazanych przez nas podstron lub całej witryny.

Narzędzie do porównywania treści

Darmowe narzędzie pozwala na porównaniu treści dwóch stron WWW lub dwóch wklejonych przez nas fragmentów treści. Przydaje się kiedy publikujemy kilka tekstów na ten sam temat w obrębie różnych witryn lub kiedy samodzielnie zdiagnozujemy potencjalny duplikat i chcemy sprawdzić jego skalę.

Copyscape - Podsumowanie

Copyscape to najpopularniejsze narzędzie (obok ręcznej weryfikacji kopii tekstów poprzez wyszukiwarkę Google) do analizy duplikacji zewnętrznej. Nic dziwnego. W zasadzie ofertuje tylko tyle i aż tyle, doskonale pełniąc swoją rolę.

Kopie treści  w obrębie witryny – Analiza duplikacji wewnętrznej

Do zwalczania zjawiska duplikacji treści należy podejść dwutorowo, doszukując się kopii nie tylko poza własną witryną, ale także w jej obrębie. W zadaniu tym również uzyskamy pomoc narzędziową, w dodatku za sprawą tej samej firmy, która każdego dnia dostarcza webmasterom narzędzie Copyscape – Indigo Stream Technologies.

Narzędzie Siteliner

Narzędzie Siteliner pozwala na pełną analizę duplikacji treści w obrębie domeny. Już od samego wyświetlenia głównego okna narzędzia, na myśl może przyjść bardzo duże podobieństwo do Copyscape. Mechanizm działania jest jednak nieco inny. Siteliner, już w podstawowej wersji, dokonuje analizy całej domeny pod kątem duplikacji wewnętrznej (W przypadku podstawowej wersji Copyscape narzędzie poszukuje duplikatów dla konkretnego adresu URL).

Okno główne narzędzia Siteliner

Czy Siteliner jest płatny?

Narzędzie Siteliner pozwala na jednokrotną darmową analizę witryny w ciągu miesiąca (30 dni), liczącą do 250 podstron. W przypadku chęci wykonania dodatkowej analizy albo większej witryny, koniecznością będzie skorzystanie z wersji Premium narzędzia, która pobiera 1 cent za każdą analizowaną podstronę. Siteliner pozwala także na ustawienie limitu stron, które weźmie pod uwagę, co zapobiega nieoczekiwanemu przekroczeniu budżetu.

Analiza raportu z Sitelinera

Raport podsumowujący

Raport narzędzia Siteliner, w porównaniu do Copyscape jest nieco bardziej złożony. Główne okno przedstawia listę potencjalnych głównych problemów witryny oraz przedstawione na wykresach podsumowanie, dotyczące:

  • podstron wziętych pod uwagę / zignorowanych podczas skanowania,
  • procentowej zawartości treści unikalnej / zduplikowanej / elementów stałych witryny,
  • porównania analizowanej witryny do innych – w skład porównania wchodzą między innymi średni rozmiar strony, czas ładowania, liczba słów na stronę czy Text to HTML Ratio.
Podstawowe podsumowanie raportu narzędzia Siteliner
Dodatkowe dane podsumowujące narzędzia Siteliner

Raport szczegółowy duplikacji treści

Dane podsumowujące dostarczają nam ogólną ocenę unikalności treści w naszym serwisie. Aby jednak zdiagnozować, które podstrony zawierają treść zduplikowaną, musimy skorzystać z raportu szczegółowego, który znajdziemy pod nazwą „Duplicate content”. Raport zawiera listę adresów URL, liczbę potencjalnych duplikatów, procent zduplikowanej treści, a także liczbę słów, dla których znaleziono odpowiedniki.

Raport duplikacji treści

Po kliknięciu wybranego adresu, przechodzimy do strony podglądu, w którym kolorami zakreślone są fragmenty będące duplikatami. Obrazowo przedstawia to poniższy zrzut ekranu, pochodzący z losowo wybranej witryny w internecie:

Przykładowy raport podstrony wskazujący zduplikowane fragmenty treści

W oknie głównym widzimy, że duplikat w tym wypadku stanowi menu górne, czym nie należy się martwić. Zduplikowana jest również stopka, zawierająca linki wewnętrzne i dane kontaktowe (również element stały witryny). Pozostała część tekstu (nieobecna na zrzucie ekranu) okazała się unikalna. Co ciekawe, elementy stałe, w powyższym przypadku zostały oznaczone jako duplikat, choć narzędzie stara się rozróżniać kopie tego typu i oznaczać je jako „Common Content”

Raportowanie w Siteliner

Z dodatkowych informacji, warto wspomnieć, że Siteliner pozwala nam generować raporty PDF oraz CSV, co przyda się zwłaszcza w sytuacji, w której zamierzamy przesłać go dalej – klientowi, copywriterowi czy web developerowi. Przeważnie. W przypadku raportu liczącego powyżej 2500 rekordów, szczegółowy raport nie jest dostępny. Jeśli chcemy udostępnić raport, możemy przekazać do niego adres URL, gdzie niekiedy czeka kolejna niemiła niespodzianka – z niewiadomych powodów niemożliwe jest wejście do raportu wskazującego zduplikowane fragmenty (Taka sytuacja w przypadku naszego konta wystąpiła już dwukrotnie). Ot, taka łyżka dziegciu na sam koniec, a zarazem okazja do sprawdzenia pomocy technicznej.

Podsumowanie

Tak jak w przypadku Copyscape, trudno pokusić się o dłuższe podsumowanie także Sitelinera. Oba narzędzia nie należą do kombajnów. Są proste w obsłudze, a każde z nich spełnia przede wszystkim swoją podstawową funkcję. Robią to jednak bardzo dobrze (Choć Sitelinerowi daję minusa za problemy techniczne, które odnotowujemy na naszym koncie) i stanowią doskonałą pomoc w rękach nie tylko doświadczonych SEOwców i Copywriterów, ale także drobnych webmasterów i właścicieli swoich biznesów, którzy chcą na własną rękę sprawdzić swoją stronę internetową pod kątem duplikacji treści. A warto! Jeśli chcesz dowiedzieć się dlaczego, zapraszam do lektury pierwszej części cyklu: „Jak wykrywać, eliminować i zapobiegać duplikacji treści?”, w której omówione zostały podstawy tego zjawiska. Zapowiadamy jednocześnie trzecią, ostatnią część, która skupi się na wskazaniu praktycznych przykładów przyczyn powstawania duplikatów i sposobach ich eliminacji.  

Udostępnij: 

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

O autorze

Oktawian Kitala

Zobacz także:

TrustRank - o kontrowersyjnym algorytmie Google

W środowisku związanym z SEO często spotykany jest skrót TR (np. "listy TR"), odnoszącym się do TrustRanku strony. Pod pojęciem tym kryje się bardzo ważny dla właścicieli serwisów algorytm badający „zaufanie” strony, obliczający jej wartość m.in. na podstawie sąsiedztwa – linków przychodzących oraz wychodzących z witryny. Historia algorytmu TrustRank Algorytm TrustRank opracował Jan Pedersen z Yahoo, […]

Fox Strategy rekomendowanym ekspertem Woorank

Miło nam poinformować, że jako jedna z pierwszych firm w Polsce otrzymaliśmy certyfikat Woorank Experts i zostaliśmy Rekomendowanym Ekspertem Woorank w zakresie szeroko pojętego Digital Marketingu, ze szczególnym wyróżnieniem wiedzy z zakresu optymalizacji stron pod kątem SEO. Woorank.com jest jednym z bardziej popularnych online'owych narzędzi służących do analizy strony pod kątem jej podstawowej optymalizacji SEO i […]

Zmiany w wyszukiwarce mobilnej

21 kwietnia 2015 roku Google wprowadziło aktualizację mobilnej wersji swojej wyszukiwarki. Jest to dopiero pierwsza z wielu zaplanowanych zmian, mających na celu dostosowanie wyników wyszukiwania na smartfonach i tabletach w taki sposób, aby strony nieresponsywne i nieposiadające wersji "mobile" zniknęły z wysokich pozycji.

envelopephone-handset linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram