Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Robot wyszukujący keywords'y
Przem4S
post 11.07.2012, 21:35:09
Post #1





Grupa: Zarejestrowani
Postów: 103
Pomógł: 3
Dołączył: 26.07.2010
Skąd: Tychy

Ostrzeżenie: (0%)
-----


Mianowicie usiłuję napisać robota, który za zadanie będzie miał wyszukiwanie i zapisanie keyword'sów do pliku.
Zasada działania:
1. Robot indeksuje stronę przykladowo wchodzi na link w strefie danej domeny, lub subdomeny. Pozwala także dodać podstrony które ma omijać.
2. Pobiera zawartość danej podstrony, czyści tagi html, zlicza słowa i zapisuje słowa np. występujące częśniej niż 3 razy (przykład).
3. Zapisuje dane do pliku w katalogu takim samym jak dany link.

O tyle o ile nie mam problemu ze zliczeniem słów i ich zapisem, to mam problem z indexowaniem witryny, nie wiem jak wgl się za to zabrać.
W jaki sposób robot ma znajdować podstrony w danej subdomenie, tutaj brakuje mi pomysłu.
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 1)
krzywy36
post 11.07.2012, 21:37:41
Post #2





Grupa: Zarejestrowani
Postów: 370
Pomógł: 43
Dołączył: 1.12.2007
Skąd: Kędzierzyn Koźle

Ostrzeżenie: (0%)
-----


wchodzisz na powiedzmy stronę główną, i wychwytujesz wszystkie linki jakie na niej są, wywalasz te nienależące do domeny i po kolei wchodzisz na nie itd itd, przy okazji zapisujesz gdzieś odwiedzone żeby nie powtarzać.

Ten post edytował krzywy36 11.07.2012, 21:43:38


--------------------
pretty as a shit.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 18.07.2025 - 11:37