W pierwszej części serii, którą przeczytasz pod tym linkiem, poza wskazaniem podstawowych przyczyn powstawania kopii treści oraz sposobów jej eliminowania, przeczytasz także o rozróżnieniu zjawiska duplikacji na duplikację zewnętrzną oraz wewnętrzną. W części drugiej przyjrzymy się narzędziowej analizie stron pod kątem obu z nich. Role główne dla tego wpisu zajmują popularne narzędzia Copyscape oraz Siteliner. W tym wpisie dokonamy ich przeglądu, skupiając się na praktycznym omówieniu ich funkcji.
Kto kradnie moją treść?! – Analiza duplikacji zewnętrznej
Tworząc pierwszy wpis serii, wskazałem negatywny stosunek
Google do zewnętrznych kopii treści. Sprawiedliwie byłoby, gdyby zawsze za
duplikat karany był „pożyczający”. Praktyka pokazuje jednak, że osąd Google nie
zawsze przychyli się w tym wypadku do rzeczywistego autora. Jeśli treści ukradł
większy konkurent, portal lub Twoja treść trafiła do porównywarki cenowej, sankcje
z tego tytułu mogą spaść na Twoją witrynę lub sklep internetowy.
Narzędzie Copyscape
Na szczęście, każdy właściciel strony internetowej może sprawdzić unikalność treści swojego serwisu, wykorzystując w tym celu popularne narzędzie do analizy duplikacji zewnętrznej - Copyscape. W prostych słowach, przeszukuje ono internet w poszukiwaniu odpowiadających sobie kopii tekstów. Co więcej, Copyscape wskazuje nie tylko linki do kopii, ale także zaznacza zduplikowane fragmenty (Dzięki temu nie jesteśmy zmuszani do ich samodzielnego określania lub do wymiany całego tekstu).
Czy to jest darmowe?
I tak, i nie. Copyscape oferuje swoją najważniejszą funkcję,
czyli podstawową wyszukiwarkę duplikatów treści, za darmo, choć w ograniczonej
liczbie zapytań na dobę. Jeśli posiadasz niewielką witrynę, liczącą kilka lub
kilkanaście podstron, obędzie się bez żadnych kosztów (co najwyżej analizę
trzeba będzie rozłożyć na kilka dni). Po wyczerpaniu dziennego limitu darmowych
zapytań narzędzie przekaże nam stosowny komunikat i zaniecha weryfikacji
adresu.
Jeśli chcesz przeanalizować większą witrynę, należy założyć konto i zasilić je odpowiednią kwotą. Podstrony rozwinięte o większą ilość treści będą kosztowały ponad 20 centów za jedno zapytanie. „Lżejsze” podstrony pochłoną odpowiednio mniejszą kwotę. Analiza duplikacji może okazać się budżetowym wyzwaniem w sytuacji, w której prowadzisz sklep internetowy, a to w nich najczęściej treść jest kradziona.
Główny interfejs
Copyscape oferuje prosty i przejrzysty interfejs. Główne okno
nie pozwala na zagubienie się w dostępnych opcjach. Pozwala ono jedynie na
wpisanie adresu URL, który chcemy analizować pod kątem duplikacji treści i
kliknięcie przycisku „Go” w celu rozpoczęcia analizy:
Okno główne narzędzia Copyscape
W przypadku, w którym dla analizowanego adresu nie odnaleziono
kopii, otrzymamy na ten temat stosowny komunikat:
Komunikat o braku wykrytych duplikatów
Jeżeli narzędzie znajdzie zewnętrzne odpowiedniki naszej treści, otrzymamy zawierającą
je listę adresów URL oraz przykład skopiowanego fragmentu:
Okno rezultatów analizy duplikacji
Przykład skopiowanego fragmentu jest bardzo użyteczną
właściwością Copyscape, która pozwala na szybkie ignorowanie duplikatów
elementów stałych szablonu strony, takich jak np. modułu komentarzy (duplikat
duplikatowi nierówny).
Klikając dowolny z wyników analizy, zostaniemy przeniesieni do okna prezentującego podstronę zawierającą kopię tekstu. Z informacji dowiemy się ile słów pokrywa się z treścią źródłową oraz jaki jest nieunikalny procent treści. Copyscape zakreśla też zduplikowane fragmenty. Jak widać na poniższym zrzucie, kopią okazał się jedynie element stały, którym nie powinniśmy się przejmować.
Wskazanie zduplikowanych fragmentów treści
Premium Search czyli Copyscape w wersji Premium
Po darmowej rejestracji konta, z poziomu menu nawigacyjnego możemy
dostać się do zakładki „Premium Search” (Pamiętam, że za pierwszym razem minęło
kilka minut, zanim odnalazłem się w nawigacji dla zarejestrowanych użytkowników):
Położenie Premium Search w menu nawigacyjnym Copyscape
Warto wspomnieć, że z
poziomu okna Premium Search możemy podać nie tylko adres URL, ale także fragment
treści do analizy. Istnieje jeszcze jedna drobna nowość… Narzędzie stale
przypomina nam o kwocie pozostałej do wykorzystania.
Na co jeszcze warto zwrócić uwagę w Copyscape?
Copyscape oferuje także kilka innych funkcji, o których
warto przynajmniej wspomnieć.
Batch Search
Ręczna analiza kilkuset podstron z pewnością nie należy do najciekawszych
zajęć. Dlatego też Copyscape, z pomocą funkcji Batch Search, oferuje nam
możliwość automatycznej analizy wskazanej listy adresów.
Okno Batch Search
Premium API
Czyli coś dla deweloperów – Copyscape umożliwia nam
integrację Copyscape Premium z naszą witryną, co pozwoli na bieżącą analizę
dodawanego contentu pod kątem unikalności.
Copysentry
Warta uwagi, ale także dodatkowo płatna, funkcja Copyscape,
polegająca na systematycznej (cotygodniowej lub codziennej) analizie duplikacji
treści wskazanych przez nas podstron lub całej witryny.
Narzędzie do porównywania treści
Darmowe narzędzie pozwala na porównaniu treści dwóch stron
WWW lub dwóch wklejonych przez nas fragmentów treści. Przydaje się kiedy
publikujemy kilka tekstów na ten sam temat w obrębie różnych witryn lub kiedy samodzielnie
zdiagnozujemy potencjalny duplikat i chcemy sprawdzić jego skalę.
Copyscape - Podsumowanie
Copyscape to najpopularniejsze narzędzie (obok ręcznej
weryfikacji kopii tekstów poprzez wyszukiwarkę Google) do analizy duplikacji
zewnętrznej. Nic dziwnego. W zasadzie ofertuje tylko tyle i aż tyle, doskonale
pełniąc swoją rolę.
Kopie treści w obrębie witryny –
Analiza duplikacji wewnętrznej
Do zwalczania zjawiska duplikacji treści należy podejść
dwutorowo, doszukując się kopii nie tylko poza własną witryną, ale także w jej
obrębie. W zadaniu tym również uzyskamy pomoc narzędziową, w dodatku za sprawą
tej samej firmy, która każdego dnia dostarcza webmasterom narzędzie Copyscape –
Indigo Stream Technologies.
Narzędzie Siteliner
Narzędzie Siteliner pozwala na pełną analizę duplikacji treści w obrębie domeny. Już od samego wyświetlenia głównego okna narzędzia, na myśl może przyjść bardzo duże podobieństwo do Copyscape. Mechanizm działania jest jednak nieco inny. Siteliner, już w podstawowej wersji, dokonuje analizy całej domeny pod kątem duplikacji wewnętrznej (W przypadku podstawowej wersji Copyscape narzędzie poszukuje duplikatów dla konkretnego adresu URL).
Okno główne narzędzia Siteliner
Czy Siteliner jest płatny?
Narzędzie Siteliner pozwala na jednokrotną darmową analizę witryny w ciągu miesiąca (30 dni), liczącą do 250 podstron. W przypadku chęci wykonania dodatkowej analizy albo większej witryny, koniecznością będzie skorzystanie z wersji Premium narzędzia, która pobiera 1 cent za każdą analizowaną podstronę. Siteliner pozwala także na ustawienie limitu stron, które weźmie pod uwagę, co zapobiega nieoczekiwanemu przekroczeniu budżetu.
Analiza raportu z Sitelinera
Raport podsumowujący
Raport narzędzia Siteliner, w porównaniu do Copyscape jest
nieco bardziej złożony. Główne okno przedstawia listę potencjalnych głównych
problemów witryny oraz przedstawione na wykresach podsumowanie, dotyczące:
podstron wziętych pod uwagę / zignorowanych
podczas skanowania,
procentowej zawartości treści unikalnej /
zduplikowanej / elementów stałych witryny,
porównania analizowanej witryny do innych – w skład
porównania wchodzą między innymi średni rozmiar strony, czas ładowania, liczba
słów na stronę czy Text to HTML Ratio.
Dane podsumowujące dostarczają nam ogólną ocenę unikalności treści w naszym serwisie. Aby jednak zdiagnozować, które podstrony zawierają treść zduplikowaną, musimy skorzystać z raportu szczegółowego, który znajdziemy pod nazwą „Duplicate content”. Raport zawiera listę adresów URL, liczbę potencjalnych duplikatów, procent zduplikowanej treści, a także liczbę słów, dla których znaleziono odpowiedniki.
Raport duplikacji treści
Po kliknięciu wybranego adresu, przechodzimy do strony
podglądu, w którym kolorami zakreślone są fragmenty będące duplikatami. Obrazowo
przedstawia to poniższy zrzut ekranu, pochodzący z losowo wybranej witryny w
internecie:
Przykładowy raport podstrony wskazujący zduplikowane fragmenty treści
W oknie głównym widzimy, że duplikat w tym wypadku stanowi
menu górne, czym nie należy się martwić. Zduplikowana jest również stopka,
zawierająca linki wewnętrzne i dane kontaktowe (również element stały witryny).
Pozostała część tekstu (nieobecna na zrzucie ekranu) okazała się unikalna. Co
ciekawe, elementy stałe, w powyższym przypadku zostały oznaczone jako duplikat,
choć narzędzie stara się rozróżniać kopie tego typu i oznaczać je jako „Common
Content”
Raportowanie w Siteliner
Z dodatkowych informacji, warto wspomnieć, że Siteliner pozwala nam generować raporty PDF oraz CSV, co przyda się zwłaszcza w sytuacji, w której zamierzamy przesłać go dalej – klientowi, copywriterowi czy web developerowi. Przeważnie. W przypadku raportu liczącego powyżej 2500 rekordów, szczegółowy raport nie jest dostępny. Jeśli chcemy udostępnić raport, możemy przekazać do niego adres URL, gdzie niekiedy czeka kolejna niemiła niespodzianka – z niewiadomych powodów niemożliwe jest wejście do raportu wskazującego zduplikowane fragmenty (Taka sytuacja w przypadku naszego konta wystąpiła już dwukrotnie). Ot, taka łyżka dziegciu na sam koniec, a zarazem okazja do sprawdzenia pomocy technicznej.
Podsumowanie
Tak jak w przypadku Copyscape, trudno pokusić się o dłuższe podsumowanie także Sitelinera. Oba narzędzia nie należą do kombajnów. Są proste w obsłudze, a każde z nich spełnia przede wszystkim swoją podstawową funkcję. Robią to jednak bardzo dobrze (Choć Sitelinerowi daję minusa za problemy techniczne, które odnotowujemy na naszym koncie) i stanowią doskonałą pomoc w rękach nie tylko doświadczonych SEOwców i Copywriterów, ale także drobnych webmasterów i właścicieli swoich biznesów, którzy chcą na własną rękę sprawdzić swoją stronę internetową pod kątem duplikacji treści. A warto! Jeśli chcesz dowiedzieć się dlaczego, zapraszam do lektury pierwszej części cyklu: „Jak wykrywać, eliminować i zapobiegać duplikacji treści?”, w której omówione zostały podstawy tego zjawiska. Zapowiadamy jednocześnie trzecią, ostatnią część, która skupi się na wskazaniu praktycznych przykładów przyczyn powstawania duplikatów i sposobach ich eliminacji.
W środowisku związanym z SEO często spotykany jest skrót TR (np. "listy TR"), odnoszącym się do TrustRanku strony. Pod pojęciem tym kryje się bardzo ważny dla właścicieli serwisów algorytm badający „zaufanie” strony, obliczający jej wartość m.in. na podstawie sąsiedztwa – linków przychodzących oraz wychodzących z witryny. Historia algorytmu TrustRank Algorytm TrustRank opracował Jan Pedersen z Yahoo, […]
Miło nam poinformować, że jako jedna z pierwszych firm w Polsce otrzymaliśmy certyfikat Woorank Experts i zostaliśmy Rekomendowanym Ekspertem Woorank w zakresie szeroko pojętego Digital Marketingu, ze szczególnym wyróżnieniem wiedzy z zakresu optymalizacji stron pod kątem SEO. Woorank.com jest jednym z bardziej popularnych online'owych narzędzi służących do analizy strony pod kątem jej podstawowej optymalizacji SEO i […]
21 kwietnia 2015 roku Google wprowadziło aktualizację mobilnej wersji swojej wyszukiwarki. Jest to dopiero pierwsza z wielu zaplanowanych zmian, mających na celu dostosowanie wyników wyszukiwania na smartfonach i tabletach w taki sposób, aby strony nieresponsywne i nieposiadające wersji "mobile" zniknęły z wysokich pozycji.