Ikonka DC

Duplicate Content Checker - wyszukiwanie zduplikowanych treści

Po dłuższej przerwie przyszła pora na zaprezentowanie kolejnego ciekawego narzędzia, tym razem do hurtowego sprawdzania unikalności treści. Aplikacja którą dzisiaj omówię nosi nazwę Duplicate Content Checker, dostępna jest na platformę Windows, jej podstawowa wersja udostępniana jest całkowicie za Free. Jeśli poszukujesz ciekawego checkera, być może ta aplikacja spełni Twoje oczekiwania. Darmowa wersja posiada pewne ograniczenia, lecz bez trudu pozwala sprawdzić stopień podobieństwa tekstów. Poznaj szczegóły...

Program świetnie nadaje się do porównywania ze sobą treści, a także do określania stopnia podobieństwa na podstawie zdefiniowanych przez użytkownika przedziałów. Duplicate Content Checker pracuje w trybie wsadowym, dzięki czemu w mgnieniu oka można hurtowo porównać setki artykułów i wyłowić te, które są do siebie najbardziej zbliżone.

Przy jakich scenariuszach może przydać się sofcik? Dwa główne to...

  1. Z jednego tekstu synonimizowanego wygenerowaliśmy opisy produktów do sklepu internetowego, chcemy sprawdzić ich podobieństwo - używamy Duplicate Content Checker.
  2. Pobraliśmy opisy ze sklepu i chcemy sprawdzić ich aktualny stopień podobieństwa - tutaj również możemy wykorzystać Duplicate Content Checker.

Kilka przykładów...

W pierwszym przykładzie sprawdzane jest podobieństwo aktualnych opisów produktów w sklepie internetowym (próbka 11 opisów).

Duplicate Content Checker

Jak widzimy w tabeli Similarity Ratio treści zawarte w pliku nr 6 i 0 są do siebie podobne w 62%, z kolei plik 6 do 8 ma podobieństwo wynoszące 73%, a 3 do 2 - 98%, co oznacza powielanie opisów. Jeżeli klikniemy na danej komórce pojawią się szczegóły, gdzie na czerwono będą zaznaczone powielone części tekstu.

W drugim przykładzie sprawdzane jest podobieństwo opisów, które będą wrzucone na podstrony produktowe, teksty zostały stworzone z treści synonimizowanej (próbka 11 tekstów). Poniżej Similarity Ratio...

Content similarity ratio

Jak widać, dla treści synonimizowanej poziom podobieństwa zawiera się w przedziale 7 - 37%. Tekst synonimizowany, wielopoziomowy, 2 klasa jakości.

Poniżej wynik dla tekstu synonimizowanego, lecz o najwyższej pierwszej klasie jakości...

Articles similarity checker

Na koniec podam jeszcze przykład dla tekstu synonimizowanego otrzymanego od jednej z firm copywriterskich...

Duplicate Content Checker - teksty synonimizowane

Jak widzimy wynik jest słaby, choć za tę cenę nie dziwi mnie to, ale gdyby nawet zapłacić dobrze, wątpię że będzie ktoś w stanie uzyskać średnią zawierającą się między 10 a 15%. Niestety, jak chcemy mieć dobry tekst synonimizowany musimy sami go napisać lub znaleźć copywritera/seowca, który wie jak się pisze teksty wielopoziomowe.

Dla drugiego scenariusza program pozwala odrzucić wszystkie teksty powyżej określonej przez użytkownika wartości reprezentującej stopień podobieństwa. Inaczej mówiąc mamy możliwość zapisania tylko tych tekstów, które spełnią określony przez nas warunek. Przyznacie, że funkcja bardzo ciekawa i z pewnością nie jeden specjalista seo piszący synonimizowane teksty z niej skorzysta, choć opcja dostępna jest w płatnej wersji.

Program posiada niestety jedną istotną wadę, kompletnie nie wspiera plików UTF-8, żeby treści nie wykrzaczyły się, pliki do porównania należy zapisać w ASCII, na szczęście jest to domyślny format dla Windows, gdyby nawet zaszła potrzeba sprawdzenia pliku w niekompatybilnym formacie, są odpowiednie konwertery więc nie jest to mega utrudnienie, ale miło byłoby zobaczyć wsparcie dla plików UTF-8.

Program przydatny w zaawansowanych analizach, choć jego cena w mojej opinii nieco za wysoka. Darmowa wersja w zupełności wystarczy do rozeznania się z jakim stopniem "similarity" mamy do czynienia. Aplikację możecie pobrać ze strony autora http://www.contentduplicatechecker.com/

Domeny

Mariusz Kołacz duplicate content, Duplicate Content Checker, powielone treści

Skomentuj wpis - Komentarzy (9)

  1. Michal pisze:

    Te teksty których unikalość jest akceptowalna pisałeś sam czy gdzieś zlecasz?

  2. Mariusz Kołacz pisze:

    @Michał, teksty synonimizowane już od dłuższego czasu pisze sam. Te które były zlecane najzwyczajniej w świecie nie spełniały zakładanego poziomu jakości po wygenerowaniu, a poprzez jakość rozumie się nie tylko sensowność tekstu (ten był zachowany) ale również stopień podobieństwa. Przy zwykłym synonimizowaniu ciężko jest uzyskać dobry wynik, a firmy copywriterskie idą na ilość nie na jakość, z drugiej strony jak chcą być konkurencyjne muszą mieć rozsądne stawki, a napisanie wielopoziomowego tekstu o średnim poziomie podobieństwa 20%, w zależności od branży zajmuje od 4 do 12h, przy tekstach anglojęzycznych zajmuje to jeszcze więcej czasu, a gdy tekst musi zawierać słownictwo specjalistyczne np. często spotykane w branży medycznej to nawet dobę zajmie przygotowanie takiego tekstu, więc nic dziwnego że nikt na rynku nie pisze takich tekstów. Koszty napisania byłyby spore, licząc tylko 10zł za 1h pracy, za 1 tekst zapłacilibyśmy od 40 do 240zł netto, nie są to ceny konkurencyjne a wiemy doskonale jakie są realia rynku w PL. Tekst z trzeciego przykładu (pierwsza klasa jakości) ma 18000 znaków, z czego po wygenerowaniu wychodzą treści od 800 do 1000 zzs.

  3. Kanon24 pisze:

    W najbliższym czasie sprawdzimy przydatność przedstawionego narzędzia , bardzo ciekawy artykuł .

  4. Jaca pisze:

    Są copywriterzy, którzy piszą teksty bardzo wysokiej jakosci. Nad jednym takim tekstem pracuje się czasem dwa, trzy dni. Cena takiego tekstu to kilkaset złotych. Pisanie, że copywriterzy idą tylko na ilość, a nie na jakość, jest zbytnim uogólnieniem. Oczywiście, takich pseudo copywriterów jest większość. Winni tego są sami zamawiający. Chcą tanio i
    szybko, to otrzymują byle co za byle jakie pieniądze. W taki sposób niemożliwe jest stworzenie dobrze napisanego, chwytliwego, oryginalnego tekstu.

  5. Mariusz Kołacz pisze:

    @Jaca zgadzam się z Tobą. Parę lat temu jak jeszcze pisałem teksty dla innych to przeważnie proponowali takie stawki że pies napłakał. To niestety klienci wymuszają takie a nie inne podejście, każdy chce tanio i dobrze, tylko nie zdaje sobie sprawy, że przygotowanie tego typu tekstów wymaga czasu i przeliczając to na stawkę godzinową nikt nie będzie pracował za 1zł/h mając na utrzymaniu rodzinę, dzieci czy opłacenie rachunków, nawet student za tyle nie będzie pisał.
    Druga rzecz, jest pełno copywriterów, którzy nawet nie potrafią poprawnie zdania zbudować nie mówiąc już o tekście wielopoziomowym synonimizowanym, który wymaga jeszcze większych umiejętności. Robiłem kiedyś rekrutację copywriterów i wyszło, że połowa popełnia błędy ortograficzne, a najśmieszniejsze jest to, że przy tak niskiej jakości tekstów chcą żeby im płacić krocie. Ja rozumiem, wiele osób chce zrobić szybko i dużo za jak najwyższe stawki, jasne jest że jeśli ktoś jest dobry zasługuje na godziwe wynagrodzenie i takie osoby powinny zostać docenione, nie pozoranci tylko prawdziwi rasowi copywriterzy, którzy znają się na swojej robocie, jednak w normalnych warunkach, aby takie osoby były konkurencyjne na rynku są zmuszone do zmniejszania stawek i koło zamyka się. Próg wejścia do tej branży jest bardzo niski, stawki szerokie, oferowana jakość jeszcze bardziej rozległa, gdzie jakość do ceny nie zawsze idzie ze sobą w parze. Z pewnością nie zamierzam uogólniać i wkładać wszystkich do jednego worka, podobnie jak w każdej innej branży można znaleźć osoby solidne i tego trzymajmy się.

  6. Maciek pisze:

    Na Win XP zacina się przy ładowaniu artykułów, masz może jakieś pomysły jak temu zaradzić? Z góry dzięki za wszelaką pomoc ;)

  7. Mariusz Kołacz pisze:

    Niestety w najbliższym czasie nie będę miał dostępu do XP-ka by sprawdzić bug. Sugeruję napisać bezpośrednio do autora softu.

  8. Adam pisze:

    Artykuł naprawdę dobry. Właśnie szukałem takiego programu by móc sprawdzić podobieństwo tekstów. Od kilku dni go testuję i jest ok.

  9. Kompoz pisze:

    Dzięki za wpis i linka! Bardzo się przyda :-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Poinformuj mnie o nowych komentarzach do tego wpisu.