Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Search Engine
rydzyk
post 11.08.2003, 12:29:44
Post #1





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 11.08.2003
Skąd: Puławy/Lublin

Ostrzeżenie: (0%)
-----


Witam, to mój pierwszy post i nie wiem czy kwalifikuje się on do php PRO ale chyba tak. Będę musiał zrobić engine który przeszukuje serwisy www, np www.wp.pl w poszukiwaniu określonych słów kluczowych, następnie zapisać np. treść newsa. do bazy. Trochę na ten temat myślałem ale nie wiem za bardzo jak to zrobić :oops: jedyne co wymyśliłem to - "zapisać" stronę z wp, przeanalizować pod kontem <a href ..., i przechodzić na kolejne podstrony itd. teoria wygląda jasno aczkolwiek z realizacją znając życie będzie dużo trudniej. Może znacie jakieś linki do kodu z gotowym rozwiązaniem, chętnie obejże jak to inni robią. Może inaczej to się robi questionmark.gif
Go to the top of the page
+Quote Post
kurtz
post 11.08.2003, 12:34:20
Post #2





Grupa: Przyjaciele php.pl
Postów: 786
Pomógł: 0
Dołączył: 18.03.2002
Skąd: Wroclaw/Warszawa

Ostrzeżenie: (0%)
-----


Hej
Cytat
Witam, to mój pierwszy post i nie wiem czy kwalifikuje się on do php PRO ale chyba tak. Będę musiał zrobić engine który przeszukuje serwisy www, np www.wp.pl w poszukiwaniu określonych słów kluczowych, następnie zapisać np. treść newsa. do bazy. Trochę na ten temat myślałem ale nie wiem za bardzo jak to zrobić :oops: jedyne co wymyśliłem to - "zapisać" stronę z wp, przeanalizować pod kontem <a href ..., i przechodzić na kolejne podstrony itd. teoria wygląda jasno aczkolwiek z realizacją znając życie będzie dużo trudniej. Może znacie jakieś linki do kodu z gotowym rozwiązaniem, chętnie obejże jak to inni robią. Może inaczej to się robi ??
Pobierasz strone (sockety), wysuzkujesz odpowiednie fragemnty (wyrazenia regularne), dodajesz gdzies do plikow statycznych czy do bazy + informacje o prawach autorskich.

Jesli idzie o mnie temat nie specjalnie nadaje sie na pro.. tylko co sie nadaje? ;)

Pozdrawiam


--------------------
.. make web your home ..
Go to the top of the page
+Quote Post
e-Gandalf
post 11.08.2003, 15:35:11
Post #3





Grupa: Przyjaciele php.pl
Postów: 195
Pomógł: 0
Dołączył: 7.07.2003
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Zalezy! Moim zdaniem to sie nadaje nawet nie na pro, tylko na jakies forum na ktorym mozna by zlecic za pieniadze przygotowanie profesjonalnego skryptu smile.gif

Bo jesli ja dobrze zrozumialem, to kolega chce korzystac z wyszukiwarki WP, znajdywac wyniki i analizowac je a nastepnie okreslone wyniki kopiowac do siebie.. A to juz sporo roboty, zeby po 2 godzinach pracy goscie z WP nie ucieli naszego Ipka smile.gif
Go to the top of the page
+Quote Post
Omega
post 11.08.2003, 21:48:33
Post #4





Grupa: Zarejestrowani
Postów: 273
Pomógł: 0
Dołączył: 5.05.2003
Skąd: Mazury

Ostrzeżenie: (0%)
-----


Ja nie bardzo rozumiem o jakie newsy ci chodzi. Czy ty chcesz ściągać newsy ze znalezionych stron?questionmark.gif 8O I napisz czy te "słowa kluczowe" to te które wpisujesz do wyszukiwarki...? biggrin.gif


--------------------
<<< EB >>>
Go to the top of the page
+Quote Post
rydzyk
post 11.08.2003, 21:55:56
Post #5





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 11.08.2003
Skąd: Puławy/Lublin

Ostrzeżenie: (0%)
-----


wiec nic takiego nie chce robić laugh.gif (to do e-Gandalfa) chodzi o wyszukiwanie informacji prasowych odnośnie określonych produktów i firm jakie ukazują sie w dużych serwisach internetowych(podaje adres serwisu, kila słów np. IBM, serwer itp a do bazy zapisuje mi sie news na temat nowego serwera firmy IBM biggrin.gif .
Troche socketami sie pobawiłem i widze że to coraz mniej na php pro sie nadaje, ale cóż pewnie w trakcie bedą jeszcze problemy. Dzięki za pomoc. Może jednak ktoś ma namiar na jakiś gotowiec, nie lubie wyważać otwartch drzwi a ktoś juz pewnie coś takiego napisał.
Go to the top of the page
+Quote Post
e-Gandalf
post 12.08.2003, 17:40:02
Post #6





Grupa: Przyjaciele php.pl
Postów: 195
Pomógł: 0
Dołączył: 7.07.2003
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


eee... szkoda ;p
Go to the top of the page
+Quote Post
kwiateek
post 14.08.2003, 09:37:18
Post #7





Grupa: Zarejestrowani
Postów: 223
Pomógł: 0
Dołączył: 13.01.2003
Skąd: 3rd ball of mud behind a big ball of burning gas

Ostrzeżenie: (0%)
-----


Cytat
Trochę na ten temat myślałem ale nie wiem za bardzo jak to zrobić :oops: jedyne co wymyśliłem to - "zapisać" stronę z wp, przeanalizować pod kontem <a href ..., i przechodzić na kolejne podstrony itd. teoria wygląda jasno aczkolwiek z realizacją znając życie będzie dużo trudniej.

Wydaje mi się, że optymalniejszym rozwiązaniem byłoby skorzystanie np. z jakieś wyszukiwarki np. google.pl w poszukiwaniu określonych słów kluczowych na stronach Wirtualnej Polski. Potem pobrać linki znalezionych stron z google i przeszukiwać już skryptem.
Przykładowy kod jaki możesz wykorzystać:
[php:1:2a9717c467]<?php
###
### google search finder
### Joel De Gan
### http://listbid.com/affil/
###
function GetCurlPage ($pageSpec) {
$agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)";
$ref = "http://www.google.com";
$ch = curl_init($pageSpec);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_REFERER, $ref);
$tmp = curl_exec ($ch);
curl_close ($ch);
return $tmp;
}

// callback function
function filt($var) {
return(substr($var, 0, 4) == "http");
}

function googleresults($search){
global $main;
$GrabURL = "http://www.google.com/search?hl=en&ie=UTF-8&oe=UTF-8&q="
.$search."&btnG=Google+Search";
$parsed = parse_url($GrabURL);
$host = $parsed[host];
$parts = explode(".", $host);
$count = count($parts);
$main = $parts[$count - 2] . "." . $parts[$count - 1];
$OpenFile = GetCurlPage($GrabURL);
preg_match_all("|href="?([^"' >]+)|i", $OpenFile, $arrayoflinks);
$new = array_filter($arrayoflinks[1], "filt");
return $new;
}// end function

$new = googleresults("php");
//Listing the array

While(List(,$link) = Each($new)){
if(substr_count($link, $main)==0 && substr_count($link, "search?q")==0){
Echo "$link<Br>";
}//fi
}// wend
?>[/php:1:2a9717c467]
Zaczerpnięty z php.net (komentarze do preg_match_all).

Pozdrawiam.


--------------------
It's Time to Join the PLD Linux Generation!
<? while (!$success) { $try++; } ?>
Go to the top of the page
+Quote Post
seaquest
post 30.08.2003, 16:16:11
Post #8





Grupa: Przyjaciele php.pl
Postów: 790
Pomógł: 7
Dołączył: 6.02.2003
Skąd: Polska

Ostrzeżenie: (0%)
-----


a nie latwiej skorzystac z site: wp.pl a pozniej socketem :?:

EDIT
Stymże sockety strasznie dlugo sie laduja, pamietajcie o tym, a skrypt pokazany na forum niestety nie zapewnia tez swietnej, szybkiej pracy.
Go to the top of the page
+Quote Post
bartek_matosiuk
post 20.11.2003, 10:58:37
Post #9





Grupa: Zarejestrowani
Postów: 2
Pomógł: 0
Dołączył: 20.11.2003
Skąd: Lublin

Ostrzeżenie: (0%)
-----


wiesz co a ja mam inna propozycje ... moglbys urzyc isniejacych enginow (IMHO mnoGoSearch jest najlepszy) i po prostu zindeksowac interesujaca cie domene. Wtedy mnogo odwali za ciebie cala robote bedziesz mial wszystko w bazie danych, slowa kluczowe powazone itp. A nadmienie jeszcze tylko ze mnoGoSearch ma calkiem fajny interface dla php. Ostatnio implementowalem ten system i zarowno instalacja jak i koniguracja indexera sa dosc proste wiec nie powinno ci to nastreczyc problemu.

To jest oficjalna strona projektu: http://www.mnogosearch.org/ . Calkiem niezla dokumentacja i webboards na ktorych otrzymasz odpowiedz chyba na kazde pytanie.
Go to the top of the page
+Quote Post
tumeks
post 22.11.2003, 19:07:38
Post #10





Grupa: Zarejestrowani
Postów: 123
Pomógł: 0
Dołączył: 10.11.2003
Skąd: Poznań

Ostrzeżenie: (0%)
-----


DZENX wam za to co napisaliscie
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 19.07.2025 - 07:47