Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [php]wyciąganie tekstu ze strony
skabszo
post
Post #1





Grupa: Zarejestrowani
Postów: 69
Pomógł: 0
Dołączył: 27.08.2004

Ostrzeżenie: (0%)
-----


witam mam pytanie otóż robię stronę dla znajomego który zajmuje się handlem organów kościelnych. Jakbyście mogli zerknąć na tę stronę byłbym wdzięczny - http://www.ahlbornorgans.com/eng/products/..._regted_eng.htm - chodzi o te wszystkie dane, to są tzw rejestry. I tu moje pytanie - czy da się jakoś zrobić by wyciągnąć z tego źródła sam tekst? bo próbowałem tak:
  1. <?php
  2. $plik=file("http://adres.bla.pl");
  3.  
  4. for($x<180; $x<300; $x++)
  5. {
  6. echo $plik[$x];
  7. }
  8. ?>
ale niestety takie cóś to pobiera wszystko łącznie ze źródłem i tu dochodze do problemu gdyż w źródle są błędy np stosowanie znacznika nobr który się nie waliduje, a głównym założeniem strony była pełna walidacja. Dotychczas mi się to udawało jednak teraz nie bardzo wiem jak to przejść. Wiem że moge skopiować tekst, wkleić do worda i zapisać jako pdf ( to w ostateczności ) ale chciałbym jakoś to spróbować zrobić właśnie metodą html/php. A że php dopiero się zaczynam uczyć toteż moja wiedza ograniczona jest do minimum. Próbowałem z File_get_contents(); ale nie wyszło..
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
strife
post
Post #2





Grupa: Przyjaciele php.pl
Postów: 2 605
Pomógł: 96
Dołączył: 22.10.2004
Skąd: UK

Ostrzeżenie: (0%)
-----


  1. <?php
  2. // ...
  3. $tekst = file_get_contents($url);
  4. preg_match_all('@<div class="featReg">(.*)<!--end content -->@siU', $tekst, $wynik);
  5. echo '<pre>';
  6. var_export($wynik); // $wynik[0][0]
  7. echo '</pre>';
  8. ?>


Teraz musisz te dane obrobić sobie ( jeśli chcesz się pozbyć tagów ), czyli w podobny sposób wyciągasz dane, mogą Ci się też przydać operacje na string'ach - odsyłam do manuala. Jeszcze trochę pracy przed Tobą (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg)

Pozdrawiam.
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 8.10.2025 - 19:44