Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [php]wyciąganie tekstu ze strony
skabszo
post
Post #1





Grupa: Zarejestrowani
Postów: 69
Pomógł: 0
Dołączył: 27.08.2004

Ostrzeżenie: (0%)
-----


witam mam pytanie otóż robię stronę dla znajomego który zajmuje się handlem organów kościelnych. Jakbyście mogli zerknąć na tę stronę byłbym wdzięczny - http://www.ahlbornorgans.com/eng/products/..._regted_eng.htm - chodzi o te wszystkie dane, to są tzw rejestry. I tu moje pytanie - czy da się jakoś zrobić by wyciągnąć z tego źródła sam tekst? bo próbowałem tak:
  1. <?php
  2. $plik=file("http://adres.bla.pl");
  3.  
  4. for($x<180; $x<300; $x++)
  5. {
  6. echo $plik[$x];
  7. }
  8. ?>
ale niestety takie cóś to pobiera wszystko łącznie ze źródłem i tu dochodze do problemu gdyż w źródle są błędy np stosowanie znacznika nobr który się nie waliduje, a głównym założeniem strony była pełna walidacja. Dotychczas mi się to udawało jednak teraz nie bardzo wiem jak to przejść. Wiem że moge skopiować tekst, wkleić do worda i zapisać jako pdf ( to w ostateczności ) ale chciałbym jakoś to spróbować zrobić właśnie metodą html/php. A że php dopiero się zaczynam uczyć toteż moja wiedza ograniczona jest do minimum. Próbowałem z File_get_contents(); ale nie wyszło..
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
skabszo
post
Post #2





Grupa: Zarejestrowani
Postów: 69
Pomógł: 0
Dołączył: 27.08.2004

Ostrzeżenie: (0%)
-----


o dzieki:) powiedz mi tylko jedno - czemu jak stosuje ten skrypt to dane wyciągniete są zduplikowane? tzn no wpierw pojawiają się raz później odstep i znow? taka jest wlasnosc preg_match_all?
Go to the top of the page
+Quote Post
strife
post
Post #3





Grupa: Przyjaciele php.pl
Postów: 2 605
Pomógł: 96
Dołączył: 22.10.2004
Skąd: UK

Ostrzeżenie: (0%)
-----


Cytat(skabszo @ 8.07.2007, 10:53:11 ) *
o dzieki:) powiedz mi tylko jedno - czemu jak stosuje ten skrypt to dane wyciągniete są zduplikowane? tzn no wpierw pojawiają się raz później odstep i znow? taka jest wlasnosc preg_match_all?


Nie są zduplikowane, var_export" title="Zobacz w manualu PHP" target="_manual pokazuje wszystkie elementy tablicy, dlatego masz takie wrażenie. Zrób sobie prosty przykład, z użyciem preg_match_all" title="Zobacz w manualu PHP" target="_manual, albo zobacz te w manualu.

Jak byś zrobił:

  1. <?php
  2. // ...
  3. echo $wynik[0][0];
  4. ?>


To miałbyś tylko raz to wyświetlone, bo odwołujemy się do danego elementu w tablicy. Poczytaj (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg)

Pozdrawiam.
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 7.10.2025 - 04:59