Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [PHP] simple html dom nie działa na OLX
Arek00
post 3.01.2020, 20:29:10
Post #1





Grupa: Zarejestrowani
Postów: 177
Pomógł: 0
Dołączył: 8.11.2005

Ostrzeżenie: (0%)
-----


Witam, mam prosty kod który ma wyświetlić wszystkie odnośniki z danej strony. Niestety przy próbie pobrania odnośników z OLX nie zwraca nic, a na innych stronach działa bez problemu. Czy oni mają jakieś zabezpieczenie? Czy da się to obejśc?

  1. <?php
  2. include('simple_dom/simple_html_dom.php');
  3.  
  4. $strona = 'https://www.olx.pl';
  5.  
  6. $html = file_get_html($strona);
  7. foreach($html->find('a') as $element) {
  8. echo $element . '<br />';
  9. }
  10. ?>
Go to the top of the page
+Quote Post
nospor
post 3.01.2020, 21:39:24
Post #2





Grupa: Moderatorzy
Postów: 36 446
Pomógł: 6292
Dołączył: 27.12.2004




Patrzyles w ogole co ci zwraca kod tej strony w php?


--------------------

"Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista
"Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer

Go to the top of the page
+Quote Post
ohm
post 3.01.2020, 21:59:39
Post #3





Grupa: Zarejestrowani
Postów: 618
Pomógł: 143
Dołączył: 22.12.2010

Ostrzeżenie: (0%)
-----


Cytat(nospor @ 3.01.2020, 21:39:24 ) *
Patrzyles w ogole co ci zwraca kod tej strony w php?

Przeciez szybciej jest na forum napisac niz sprawdzic co tam jest biggrin.gif
Go to the top of the page
+Quote Post
Arek00
post 4.01.2020, 14:13:29
Post #4





Grupa: Zarejestrowani
Postów: 177
Pomógł: 0
Dołączył: 8.11.2005

Ostrzeżenie: (0%)
-----


Cytat(nospor @ 3.01.2020, 21:39:24 ) *
Patrzyles w ogole co ci zwraca kod tej strony w php?

udało mi się odczytać komunikat:

"Z Twojego adresu IP pochodzi ruch, który nie jest dla nas zaufany. Może to pomyłka, więc spróbuj ponownie wejść na stronę za 10 minut. Jeżeli problem się powtórzy, skontaktuj się z nami".

Czy to miałeś na myśli? Czy to znaczy że nic z tego nie będzie?


Cytat(ohm @ 3.01.2020, 21:59:39 ) *
Przeciez szybciej jest na forum napisac niz sprawdzic co tam jest biggrin.gif

Proszę Cię nie zaśmiecaj wątku jeśli nie masz nic merytorycznego do dodania.
Go to the top of the page
+Quote Post
trueblue
post 4.01.2020, 14:34:50
Post #5





Grupa: Zarejestrowani
Postów: 6 761
Pomógł: 1822
Dołączył: 11.03.2014

Ostrzeżenie: (0%)
-----


https://stackoverflow.com/questions/1945511...html-dom-parser

W PHP istnieją wbudowane klasy do parsowania kodu HTML (DOMDocument oraz DOMXPath).
https://kawalekkodu.pl/the-tag-is-out-there...domxpath-s01e01


--------------------
Go to the top of the page
+Quote Post
Tomplus
post 4.01.2020, 20:05:23
Post #6





Grupa: Zarejestrowani
Postów: 1 834
Pomógł: 225
Dołączył: 20.03.2005
Skąd: Będzin

Ostrzeżenie: (0%)
-----


W ogóle pobierając stronę to wysyłasz jakiś nagłówek który przedstawia się jako konkretna przeglądarka?
Też będzie łatwiej:

np. User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.3
Go to the top of the page
+Quote Post
Arek00
post 5.01.2020, 14:32:59
Post #7





Grupa: Zarejestrowani
Postów: 177
Pomógł: 0
Dołączył: 8.11.2005

Ostrzeżenie: (0%)
-----


Ustawiłem user agent w php.ini i zadziałało smile.gif Dziękuję trueblue i Tomplus za podpowiedzi.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 19.04.2024 - 10:39