![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 23 Pomógł: 0 Dołączył: 17.03.2004 Ostrzeżenie: (0%) ![]() ![]() |
Czy jest jakaś możliwość sprawdzenia, czy "osoba" wchodząca na stronę to wyszukiwarka?
Wiem, że niektóre wyszukiwarki zostawiają ślad w $HTTP_USER_AGENT, np.: Googlebot/2.1 (+http://www.google.com/bot.html) ale czy wszystkie? Może jest jakiś inny sposób? |
|
|
![]()
Post
#2
|
|
![]() Grupa: Zarejestrowani Postów: 602 Pomógł: 1 Dołączył: 3.04.2004 Skąd: Trójmiasto (Gdańsk) Ostrzeżenie: (0%) ![]() ![]() |
podawanie innych stron wyszukiwarkom a innych zwyklym uzykownikom - takie techniki sa niebezpieczne: np. Google podobno robi tak, że indeksuje strony przedstawiajac sie jako googlebot, ale sprawdza je również podszywajac sie pod zwykle przegladarki, i jesli wykryje znaczne roznice to tracisz w wynikach wyszukiwania.
-------------------- |
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 23 Pomógł: 0 Dołączył: 17.03.2004 Ostrzeżenie: (0%) ![]() ![]() |
Konkretnie chodzi mi o taką sprawę:
mam ranking stron, na które głosuje się po kliknięciu na baner na stronie, na którą się głosuje (zwykła toplista). I chciałbym zabezpieczyć jakoś skrypt, żeby nie przyjmował głosów "oddanych" przez wyszukiwarki. Czyli jak robot indeksuje strony, to te które są indeksowane częściej mają sztuczną liczbę głosów na topliście... |
|
|
![]()
Post
#4
|
|
![]() Developer Grupa: Moderatorzy Postów: 2 844 Pomógł: 20 Dołączył: 25.11.2003 Skąd: Olkusz ![]() |
Fragment pochodzi z http://webcity.pl/webcity/artykuly.php/t/55 Nie zakazuj botom wyszukiwarek wchodzi na Twoja topliste tylko poprostu nie zliczaj ich "klikniec" ( przed dodanie +1 do glosu poprostu sprwdz user agneta czy to nie bot jak bot do nie dodawaj klikniecia) Cytat(http://en.wikipedia.org/wiki/User_agent) Bots:
* Crawler for Ask Jeeves/Teoma: Mozilla/2.0 (compatible; Ask Jeeves/Teoma) * Googlebot: Googlebot/2.1 (+http://www.googlebot.com/bot.html) * Grub: Mozilla/4.0 (compatible; grub-client-1.4.3; Crawl your own stuff with http://grub.org) * MSN bot: msnbot/0.11 (+http://search.msn.com/msnbot.htm) * wget: Wget/1.9 * Yahoo! Slurp: Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp) |
|
|
![]()
Post
#5
|
|
![]() Grupa: Zarejestrowani Postów: 449 Pomógł: 0 Dołączył: 26.05.2004 Skąd: Nowy Sącz Ostrzeżenie: (0%) ![]() ![]() |
A jak wykryc bota InfoSeek z Onetu i NetSprint z WP ?
-------------------- |
|
|
![]()
Post
#6
|
|
![]() Grupa: Przyjaciele php.pl Postów: 5 724 Pomógł: 259 Dołączył: 13.04.2004 Skąd: N/A Ostrzeżenie: (0%) ![]() ![]() |
Netsprint pojawia sie pod kilkoma nazwami:
http://www.kki.pl/kki/statystyka/agent_200205.html http://forum.optymalizacja.com/ftopic11.html Przeszukaj neta: googlebot netsprint infoseek -- i dojdziesz do takich listingow statystyk. A na oficjalnych stronach nie znalazlem zadnego info (moze jest trudniej dostepne -- nie szukalem dlugo) -------------------- Nie lubię jednorożców.
|
|
|
![]()
Post
#7
|
|
![]() Grupa: Zarejestrowani Postów: 188 Pomógł: 0 Dołączył: 23.05.2005 Ostrzeżenie: (0%) ![]() ![]() |
Tez kiedys sie zastanawialem nad tym gdzie wlaza i co robia przegladarki. Mysle ze jest na to sposob. Po pierwsze bodajze w katalogu glownym strony umieszcza sie plik 'robots.txt', w ktorym zapisuje sie podkatalogi do ktorych nie rzyczymy sobie aby boty wchodzily. Jesli boty sa uczciwe to beda przestrzegac regul zapisanych w tym pliku (pierwszy lepszy link do opisu http://www.searchengineworld.com/robots/robots_tutorial.htm).
Jesli jednak tak nie jest mozna troche pokombinowac. Pozwolcie ze bede glosno myslec, bo nie jestem tego pewien ale na logike to powinno dzialac ![]() ![]() |
|
|
![]() ![]() |
![]() |
Wersja Lo-Fi | Aktualny czas: 18.07.2025 - 04:07 |