Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [PHP] cURL pobieranie dużej ilości danych i wsadzanie ich do bazy
piotrex41
post
Post #1





Grupa: Zarejestrowani
Postów: 168
Pomógł: 26
Dołączył: 15.09.2011
Skąd: Wrocław

Ostrzeżenie: (0%)
-----


Witam,

Co prawda z PHP mam kontakt od 3 lat, to tematyka cURL jest mi kompletnie obca, a niestety muszę go użyć. Przechodzę do sedna:

Na praktykach dostałem do napisania serwis z ogłoszeniami dla osób poszukujących pracę. Pracodawcy dodają oferty itp. Całość napisana obiektowo, ale jest jedna rzecz na której się zaciąłem. Mianowicie właśnie cURL. Chodzi o automatyczne pobiernie ofert pracy z http://www.pup.gliwice.pl/klient/oferty_pracy.html Niestety nie ma tam RSSa więc trzeba to jakoś wyciągnąć sposobem, którym właśnie jest cURL.

Problem polega na tym, że na tej stronie są jedynie "zajawki" ofert a pełny opis (który muszę pobrać) znajduje się w linku, otwieranym w nowym oknie JS po kliknięciu.

Skrypt ma codziennie o godzinie 18 sprawdzać czy są nowe oferty i je dodawać do moderacji (moderacja jest już zrobiona, trzeba tylko wrzucać zapytaniem do bazy danych pobrane oferty).

Kompletnie nie wiem jak mam się za to zabrać. Dla mnie cURL to czarna magia. Wiem że pobrane źródło muszę filtrować regexp'ami, ale nic pozatym (IMG:style_emoticons/default/tongue.gif)

Połączenie już zrobiłem, źródło mam, ale dalsze grzebanie to już masakra dla mnie.

Bardzo proszę o pomoc.

Ten post edytował piotrex41 24.05.2012, 08:22:45
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
piotrex41
post
Post #2





Grupa: Zarejestrowani
Postów: 168
Pomógł: 26
Dołączył: 15.09.2011
Skąd: Wrocław

Ostrzeżenie: (0%)
-----


No dobra, mam całe źródło, i teraz tak. Każda oferta jest linkiem do kolejnej, więc musze te linki wyciagnąć. Oto kawałek kodu HTML jednej oferty:

  1. <table class="ogolna1 oferta_mater" style="width:330px; " >
  2. <tr>
  3. <th colspan="2" style="text-align:center"><a onclick="showPopupWindow(this.href,712,560);return false;" href = "http://www.pup.gliwice.pl/klient/oferta/1285.html">Tapicer</a></th>
  4. </tr>
  5. <tr>
  6. <td class="lewa_s">Nr oferty:</td>
  7. <td class="prawa_s">StPr/12/1448</td>
  8. </tr>
  9. <tr>
  10. <td class="lewa_s">Miejsce pracy:</td>
  11. <td class="prawa_s">44-100 Gliwice, ul. -Niemcy</td>
  12. </tr>
  13. <tr>
  14. <td class="lewa_s">Ważna od:</td>
  15. <td class="prawa_s">2012-05-24</td>
  16. </tr>
  17. </tbody>

Teraz ja muszę wyciągnąć ten link (to co się znajduje w href) - http://www.pup.gliwice.pl/klient/oferta/1285.html
Ale co bym nie zrobił, to coś nie idzie tego wyciągnąć. Mój kod:
  1.  
  2. $dane = array();
  3. for($i = 0; $i <= 10; $i++)
  4. {
  5. preg_match('/<a onclick="showPopupWindow(this.href,712,560);return false;" href = "(.+?)">/', $this->_home, $dane[]);
  6. }
  7. print_r($dane);

Co pokazuje ciągle pustą tablicę.

Jakaś wskazówka? (IMG:style_emoticons/default/smile.gif)

Ten post edytował piotrex41 24.05.2012, 11:49:20
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 7.10.2025 - 11:11