![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
![]() Grupa: Zarejestrowani Postów: 103 Pomógł: 3 Dołączył: 26.07.2010 Skąd: Tychy Ostrzeżenie: (0%) ![]() ![]() |
Mianowicie usiłuję napisać robota, który za zadanie będzie miał wyszukiwanie i zapisanie keyword'sów do pliku.
Zasada działania: 1. Robot indeksuje stronę przykladowo wchodzi na link w strefie danej domeny, lub subdomeny. Pozwala także dodać podstrony które ma omijać. 2. Pobiera zawartość danej podstrony, czyści tagi html, zlicza słowa i zapisuje słowa np. występujące częśniej niż 3 razy (przykład). 3. Zapisuje dane do pliku w katalogu takim samym jak dany link. O tyle o ile nie mam problemu ze zliczeniem słów i ich zapisem, to mam problem z indexowaniem witryny, nie wiem jak wgl się za to zabrać. W jaki sposób robot ma znajdować podstrony w danej subdomenie, tutaj brakuje mi pomysłu. |
|
|
![]()
Post
#2
|
|
![]() Grupa: Zarejestrowani Postów: 370 Pomógł: 43 Dołączył: 1.12.2007 Skąd: Kędzierzyn Koźle Ostrzeżenie: (0%) ![]() ![]() |
wchodzisz na powiedzmy stronę główną, i wychwytujesz wszystkie linki jakie na niej są, wywalasz te nienależące do domeny i po kolei wchodzisz na nie itd itd, przy okazji zapisujesz gdzieś odwiedzone żeby nie powtarzać.
Ten post edytował krzywy36 11.07.2012, 21:43:38 -------------------- pretty as a shit.
|
|
|
![]() ![]() |
![]() |
Wersja Lo-Fi | Aktualny czas: 18.07.2025 - 03:07 |