Tak jak w temacie, jakim sposobem można zablokować dostęp do strony robotom skanującym stronę bez przymusowego wykorzystania blokowania adresów IP.
Np wrzuta blokuje pobieranie wyników przy zwykłym zassaniu treści przez funkcję file_get_contents lub curl bez grubego kodu.
Czy są zmienne, które istnieją na stałe?

Coś jak rozróżnianie user_agent nie wchodzi w grę... łatwo można podmienić.