Ponad rok temu zaprezentowałem czytelnikom małą zgrabną aplikację Bing Host Scraper, dzięki której każdy mógł szybko wydobyć z wyszukiwarki Bing jakie strony współdzielą dany adres IP. Tym razem przedstawiam aplikację RitX Reverse DNS Lookup Tool, której autorem jest Adwiteeya Agrawal. Narzędzie napisane w Perlu, nie wymaga instalacji, program bez trudu uruchomimy na dowolnej platformie wyposażonej w środowisko Perl (Windows, Linux). Program bardzo ciekawy, który może być wykorzystany do różnych celów, nie tylko związanych z SEO.
Aplikacja uwzględnia tylko lub jak kto woli aż 14 serwisów Reverse DNS Lookup. Niestety nie wspiera wszystkich bezpłatnych z API, dlatego pewnie prędzej czy później stworzę własną apkę rozszerzoną o kilkanaście innych przydatnych serwisów, jednak zanim to nastąpi musi mi wystarczyć RitX i dedykowany skrypt napisany w iMacros, które razem tworzą całkiem ciekawą alternatywę do odczytywania danych Reverse DNS Lookup.
Aktualnie wspierane serwisy Reverse DNS Lookup (RitX):
- Ewhois.com
- Pagesinventory.com
- Viewdns.info (API)
- Yougetsignal.com
- Myiptest.com
- Ip-adress.com
- DNStrails.com
- My-ip-neighbors.com
- Domainsbyip.com
- Bing.com
- Whois.WebHosting.info
- Robtex.com
- Tools.web-max.ca
- Sameip.org
Instalacja i uruchomienie RitX
RitX dostarczany jest w formie archiwum, które wystarczy rozpakować w dowolnym miejscu. Program główny znajduje się pod postacią pliku RitX.pl. Oczywiście do wykonania skryptu będzie potrzebne środowisko Perl, jednym z powszechniejszych na platformę Windows jest ActivePerl, które należy wpierw zainstalować. ActivePerl można pobrać z oficjalnej strony www.activestate.com
Po zainstalowaniu środowiska uruchamiamy wiersz poleceń, WIN+R => cmd.exe. RitX wypakowałem do katalogu D:\SEO-TOOLS\ritx, w związku z czym wpierw przejdę do podanego katalogu wpisując w oknie konsoli:
cd /d "D:\SEO-TOOLS\ritx"
Będąc w katalogu RitX możemy już zabrać się za zescrapowanie pierwszych danych. W przykładzie, chcę pozyskać informacje na temat domen znajdujących się obok techformator.pl i zapisać wszystko do pliku w formacie TXT, w tym celu wpiszę:
RitX.pl -b -t techformator.pl -o techformator.txt
Plik TXT zostanie zapisany w katalogu ze skryptem, przy czym oddzielnie zostanie zapisany plik z adresami dla bing.com. Informacje na temat użytych w zapytaniu parametrów można znaleźć w plikach pomocy lub wywołując w konsoli ekran pomocy (RitX.pl -h).
Aplikacja dla tego zapytania pobrała łącznie 259 adresów, z czego 106 to unikalne domeny. Warto powiedzieć, że autor dodał opcję by pobierać dane korzystając z darmowego API Binga, jednak niestety ta funkcja nie działa do końca prawidłowo, wprawdzie pobierane są „oczka” za skorzystanie z API, ale nie widać efektów w postaci pobierania dodatkowych informacji (nawet uwzględniając parametr max, albowiem w tym scenariuszu RitX powinien pobrać 287 adresów, z czego 208 to unikalne domeny). Więcej informacji na temat API Binga znajdziesz tutaj.
Polecenie RitX uwzględniające API Binga wygląda podobnie, jednakże wpierw musisz uzupełnić klucz API w pliku RitX.pl – otwórz go do edycji w Notepad++ lub innym edytorze programistycznym, przejdź do linii 271 i podmień istniejący klucz na własny, następnie zachowaj zmiany. Po tym zabiegu możesz odpalić skrypt z funkcją Bing API, choć tak jak napisałem wcześniej, ów funkcjonalność u mnie nie działa. Jeżeli udało Ci się odpalić program z tą funkcją napisz o tym w komentarzu wraz z instrukcją jak tego dokonałeś 🙂
Warto jeszcze wspomnieć, że sofcik wspiera proxy oraz pozwala sprawdzić zebrane hosty. Najnowszą wersję RitX można pobrać z tej lokalizacji – http://code.google.com/p/ritx/
PS. Jak tylko znajdę więcej czasu napiszę do scrapowania danych swoją aplikację, która w całości zastąpi wysłużonego Bing Host Scrapera.
Bardzo przydatne informacje na temat tej aplikacji 🙂
Bardzo ciekawy artykuł tego jeszcze nie wiedziałem o tej aplikacji. Trzeba będzie się jej bliżej przyjrzeć! strona wpada do ulubionych, czekam na więcej takich obiecujących wpisów.