Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [php][psml][curl] pozyskiwanie danych ze strony
krom
post
Post #1





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 17.02.2011

Ostrzeżenie: (0%)
-----


Witam
Mam problem z pozyskaniem strony
  1. http://www.ekoportal.pl/jetspeed/portal/portal/wykaz.psml?stl=1&unit=105060&type=E

Za pomocą Curl`a chciałem pozyskać zamieszczone tam dane, niestety nie wiem jak przechodzić między stronami. Za wszelkie sugestie będę bardzo wdzięczny.
Pozdrawiam.

Ten post edytował krom 17.02.2011, 05:07:56
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
krom
post
Post #2





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 17.02.2011

Ostrzeżenie: (0%)
-----


Niestety dotychczasowe sposoby nie przyniosły spodziewanego rezultatu
Zmagając się z tym zadaniem doszedłem do konkluzji iż problemem może być treść nagłówka HTTP przekazywana przez cURL

Obecnie próbowałem używać takiego fragmentu kodu:
  1. <?php
  2. $naglowki = array(
  3. 'Host: www.ekoportal.pl',
  4. 'User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; pl; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13',
  5. 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
  6. 'Accept-Language: pl,en-us;q=0.7,en;q=0.3',
  7. 'Accept-Encoding: gzip,deflate',
  8. 'Accept-Charset: ISO-8859-2,utf-8;q=0.7,*;q=0.7',
  9. 'Keep-Alive: 115',
  10. 'Connection: keep-alive',
  11. 'Referer: <a href="http://www.ekoportal.pl/jetspeed/portal/_ns:YWNhcmRMaXN0c1BvcnRsZXR8YzB8ZDA_/portal/wykaz.psml'" target="_blank">http://www.ekoportal.pl/jetspeed/portal/_n...wykaz.psml'</a>,
  12. 'Cookie: JSESSIONID=3790C04872F4D25225A33D53F3D8D4B6.jboss01sep1;',
  13. 'SEPSESSIONID=SEPSESSION346515de-928c-4a42-80fa-3714151affe4.jboss01sep1',
  14. 'Content-Type: application/x-www-form-urlencoded',
  15. );
  16.  
  17. $curl = curl_init('http://www.ekoportal.pl/jetspeed/portal/portal/wykaz.psml?stl=1&unit=105060&type=E');
  18. curl_setopt($curl, CURLOPT_HEADER, 1);
  19. //curl_setopt($curl, CURLOPT_NOBODY, 1);
  20. curl_setopt($curl, CURLOPT_HTTPHEADER, $naglowki);
  21. curl_setopt($curl, CURLOPT_COOKIEJAR, "cookies.txt");
  22. curl_setopt($curl, CURLOPT_COOKIEFILE, "cookies.txt");
  23. curl_setopt($curl, CURLOPT_POST, TRUE );
  24. curl_setopt($curl, CURLOPT_POSTFIELDS, "colSort=&tableName=allFromUnitListTable&ascending=&pageNumber=2&filter_state=0" );
  25. curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
  26. curl_setopt($curl, CURLOPT_TIMEOUT,5);
  27. $htt = curl_exec($curl);
  28. echo $htt;
  29. curl_close($curl);
  30. ?>


Pomimo ustawienia nagłówka w firebugu pokazuje mi inne nagłówki o ile zdoła się połączyć.

Kolejna rzecz że ten sam nagłówek w programie Live HTTP Headers działa bez zarzutu pozwalając skakać między stronami(o co w sumie głównie chodzi (IMG:style_emoticons/default/smile.gif) )
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 14.10.2025 - 07:24