disavow-utility

Narzędzie do usuwania linków a domena IDN z polskimi znakami

W ostatnim czasie musiałem wykluczyć na jednej z domen sporą część linków, które były dziełem innej osoby. W związku z tym, że nie można było w żaden sposób skontaktować się z administratorem tych stron postanowiłem wykluczyć linki poprzez narzędzie Disavow. Ale okazuje się, że nie jest to takie proste zadanie. Zapewne powiecie wgraj plik i po zabawie. A co zrobić gdy nie da się go wgrać?

Problem próbowałem zdiagnozować, wykonałem serię testów wgrywania na kilku przeglądarkach między innymi Chrome, Firefox, sprawdzałem także sytuację na kilku komputerach i kilku różnych adresach IP. Wszędzie był podobny błąd - nie można było wgrać pliku.

Sam plik disavow zawierał definicje wykluczające zarówno linki bezpośrednie, jak i całe domeny. Podczas testów zauważyłem ciekawą rzecz, gdy plik miał ok. 100 wykluczeń wgrywał się bez problemu, natomiast gdy dodano do niego nowe wykluczenia (łącznie ponad 900), nagle nie dało się uaktualnić pliku disavow. W panelu zwyczajnie plik wykluczeń wyparował.

Poniżej cała procedura jak wyglądał mój test...

1) Wczytanie mniejszego pliku (do 100 wpisów) i przesłanie go na serwer - operacja zakończona powodzeniem.

Disavow.txt

2) Rozbudowanie pliku disavow (ponad 900 wpisów) i ponowne wgranie. Oczywiście pojawił się komunikat Google o nadpisywaniu. Po zatwierdzeniu operacji rozpoczyna się przesyłanie pliku, a po zakończeniu plik disavow totalnie wyparowuje z panelu!

Linki zrzeczenia się

Dodam jeszcze że plik disavow był zapisany w standardzie ANSI, kodowanie ustawione przy użyciu programu Notepad++.

Po dalszej analizie przyszło rozwiązanie!

Zakup domeny a kary Google

Nie daj się oszukać! Sprawdź domenę przed zakupem...

Czytaj dalej »

Początkowo zbił mnie z tropu wpis Sebastiana Miśniakiewicza, który stwierdził że Google rozpoznaje polskie nazwy domen w pliku disavow. Okazuje się jednak że NIE rozpoznaje!

Jak poprawnie dodać do disavow domenę z polskimi znakami

Po przekonwertowaniu domen do punycode przy pomocy darmowego IDNS Translatora, plik disavow wgrał się bez najmniejszych problemów! Wynika z tego, że wszelkie domeny narodowe muszą być (nie mogą tylko muszą!) przekonwertowane do punycode, w przeciwnym wypadku nie będzie można wgrać pliku.

EDIT: Google wprowadziło już obsługę błędów i informuje o problemach podczas przesyłania pliku do narzędzia Google Disavow Tool.

Mariusz Kołacz disavow tool, domeny IDN, narzędzie do usuwania linków, punycode

Skomentuj wpis - Komentarzy (11)

  1. Lexy pisze:

    To dość częsty problem. U mnie wystąpił po raz pierwszy, kiedy wpisałam w pliku komentarze z polskimi znakami.

    Ostatnio rozmawiałam z kilkoma osobami, którym nie pomogło skorzystanie z disavow... no i u niektórych wyszło na to, że plik nie wgrał się poprawnie, więc narzędzie nie miało szans zadziałać. A nie wgrał się właśnie przez polskie znaki, które psuły kodowanie (powinno być UTF-8).

  2. Mariusz Kołacz pisze:

    Z UTF-8 nie próbowałem wgrywać :/
    Standardowo notatnik w Windows także zapisuje pliki w ANSI.
    Powinni się domyślić i coś z tym zrobić.
    Przy błędach wgrywania (niepowodzenia) Google powinno dawać jakieś komunikaty, a tutaj brak.
    Jakby nie patrzeć na to, w ten sposób zostawiają webmastera samemu sobie.

  3. Lexy pisze:

    "Przy błędach wgrywania (niepowodzenia) Google powinno dawać jakieś komunikaty, a tutaj brak."
    Tu jedynie w GWT przychodzi info potwierdzające wgranie pliku. Ale kto się domyśli, że bez takiej informacji coś się nie powiodło?

    Sama nie rozumiem, czemu zrobili tak mało intuicyjne narzędzie. Przecież zależy im na zgłoszeniach, więc po co tak utrudniać?

  4. Mariusz Kołacz pisze:

    Też się zastanawiam. Projektują takie fajne UI w innych usługach Google a nie potrafią dopracować disavow toola. Wygląda jakby to narzędzie było przygotowywane na szybko czyli brutalnie mówiąc "na odwal się".

  5. Sebastian pisze:

    "Początkowo zbił mnie z tropu wpis Sebastiana Miśniakiewicza, który stwierdził że Google rozpoznaje polskie nazwy domen w pliku disavow."

    Jak widac informacje od Google nie zawsze sprawdzają się w praktyce - wpis został poprawiony :)

  6. webfighter pisze:

    Wgrywałem ostatnie domeny z polskimi ogonkami zapisane w UTF-8. Bez problemu google przyjęło plik!

  7. Mariusz Kołacz pisze:

    Na utf niby wgrywa się, tylko cytując Lexy "którym nie pomogło skorzystanie z disavow… no i u niektórych wyszło na to, że plik nie wgrał się poprawnie", czy w tej sytuacji diavow działa czy też faktycznie mamy tylko info o wgraniu pliku, a plik disavow i tak nie zadziała?

    Edytory z Windowsa mają defaultowo niestety ustawione kodowanie ANSI, wątpię, że każdy użytkownik będzie pamiętał, by zmienić ręcznie kodowanie pliku przed zapisem. Google powinno przewidzieć sytuację i poinformować webmastera o problemach w kodowaniu pliku, a w opisywanej sytuacji mamy kompletny brak jakichkolwiek wyaśnień, co więcej stary plik disavow całkiem wyparowuje, czyli wygląda na to że programiści Google dali ciała powinni wdrożyć obsługę błędów i w zależności od zaistniałego przypadku poinformować usera o problemach i najważniejsze, nie usuwać starego pliku, jeśli z nowym plikiem są jakiekolwiek problemy.
    Cóż nie będę się znęcał nad nimi, bo każdy człowiek ma prawo do popełniania błędów, ale mając tak dużo doświadczenia mogli to lepiej zrobić.

  8. Rychu pisze:

    Czegoś nie rozumiem - plik ze 100 adresami wgrał się w ANSI, a na 900 potrzeba już UTF8? A może w tej pierwszej setce nie było polskich znaków?

  9. Mariusz Kołacz pisze:

    Tak dokładnie, w pierwszej 100 nie było domen z polskimi znakami diakrytycznymi.

  10. Snaphub pisze:

    Te domeny z PL znakami to same problemy ;) nie widziałem jeszcze żadnej fajnej, która by się przyjęła w dużej firmie... mają z nimi problem również różne frameworki oraz programy instalowane na serwerach...

  11. Mariusz Kołacz pisze:

    @Snaphub, domeny IDN nadają się tylko do jednego - do przekierowania na domenę bez polskich znaków.

    Dodam jeszcze że katalogi które są na PL-kach trudniej się indeksują. Być może dlatego, że serwery XML-RPC nie potrafią poprawnie obsłużyć domen IDN (problem leży w domenach, które nie są przekształcane do postaci Punycode, tylko wysyłane są w zrozumiałej dla człowieka postaci). Nawet Google ma z nimi problem :/

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Poinformuj mnie o nowych komentarzach do tego wpisu.