Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Wyciąganie linków z Wirtualnej Polski
vnaki
post
Post #1





Grupa: Zarejestrowani
Postów: 2
Pomógł: 0
Dołączył: 29.01.2012

Ostrzeżenie: (0%)
-----


Czesc wszystkim!

Jestem na etapie uczenia sie PHP, co tu duzo mowic samoukiem z zamilowania. Obecnie eksperymentuje z wyciaganiem linkow. Pojawily sie przy tym problemy:

- nie wiem jak ominac odnosniki w obrazku, po prostu niektore linki sie dubluja(chodzi o Wirtualna Polske)
np:

<div class="content topGlo">
<h1><a href="/title,Dzieki-temu-zlapia-porywacza-6-miesiecznej-Madzi,wid,14208892,wiadomosc.html" title="Dzięki temu złapią porywacza 6-miesięcznej Madzi?">
Dzięki temu złapią porywacza 6-miesięcznej Madzi?
</a></h1>

i

<a class="ikonka" href="/title,Dzieki-temu-zlapia-porywacza-6-miesiecznej-Madzi,wid,14208892,wiadomosc.html" title="Dzięki temu złapią porywacza 6-miesięcznej Madzi?">
<img src="http://i.wp.pl/a/f/jpeg/28411/magda388.jpeg" alt="Dzięki temu złapią porywacza 6-miesięcznej Madzi?" class="fot" /><img alt="materiał wideo" class="imgIkonka" src="http://i.wp.pl/a/i/wiadomosci/2011/galeria_wideo.png">
</a>

- Chcialem aby mi pojawily sie oryginalne nazwy wiadomosci, a nie mam pomyslu jak skutecznie je pobrac.

- Wiem jak wyciagnac wszystkie linki ze strony, ale nie wiem jak oddzielic te z wiadomoscia, od tych w menu, czy tez reklam

Same odnosniki pobieralem metoda wyrazen regularnych, ale jak pisalem niektore odnosniki sie dubluja

Prosze o pomoc z tymi problemami
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 4)
adbacz
post
Post #2





Grupa: Zarejestrowani
Postów: 532
Pomógł: 24
Dołączył: 15.04.2011
Skąd: Kalisz

Ostrzeżenie: (0%)
-----


Wyrażenia regularne, dostajesz tablicę tak? To co za problem zrobić po niej pętlę i sprawdzać czy któryś z linków się powtarza?
Pseudokod:
  1. $links; //Linki z rexexp
  2. $newLinks = array(); //Filtrowane linki
  3. foreach($links as $key => $val) {
  4. foreach($newLinks as $key2 => $val2) {
  5. if($val != $val2) {
  6. $newLinks[] = $val;
  7. }
  8. }
  9. }

Takie coś powinno ząłatwić sprawę.

EDIT:
Cytat
Wiem jak wyciagnac wszystkie linki ze strony, ale nie wiem jak oddzielic te z wiadomoscia, od tych w menu, czy tez reklam

Mozesz za pomocą Wyrażeń wyciągnąć danego DIVa czy w czym sa tam trzymane dane w HTML (z pewnością znajdziesz), i w tedy sobie wyciągać linki z tego co wcześniej wyciągnąłeś. To chyba najprostrze rozwiązanie.

Ten post edytował adbacz 31.01.2012, 21:54:53
Go to the top of the page
+Quote Post
wookieb
post
Post #3





Grupa: Moderatorzy
Postów: 8 989
Pomógł: 1550
Dołączył: 8.08.2008
Skąd: Słupsk/Gdańsk




Proszę wstawić bbcode do swojego postu.
Go to the top of the page
+Quote Post
zaajcu
post
Post #4





Grupa: Zarejestrowani
Postów: 206
Pomógł: 3
Dołączył: 18.08.2011
Skąd: Chrzanów

Ostrzeżenie: (0%)
-----


Cytat(adbacz @ 31.01.2012, 21:52:36 ) *
Wyrażenia regularne, dostajesz tablicę tak? To co za problem zrobić po niej pętlę i sprawdzać czy któryś z linków się powtarza?
Pseudokod:
  1. $links; //Linki z rexexp
  2. $newLinks = array(); //Filtrowane linki
  3. foreach($links as $key => $val) {
  4. foreach($newLinks as $key2 => $val2) {
  5. if($val != $val2) {
  6. $newLinks[] = $val;
  7. }
  8. }
  9. }

Takie coś powinno ząłatwić sprawę.

EDIT:

Mozesz za pomocą Wyrażeń wyciągnąć danego DIVa czy w czym sa tam trzymane dane w HTML (z pewnością znajdziesz), i w tedy sobie wyciągać linki z tego co wcześniej wyciągnąłeś. To chyba najprostrze rozwiązanie.



Może zamiast pętli array_unique();

http://php.net/manual/en/function.array-unique.php
Go to the top of the page
+Quote Post
wookieb
post
Post #5





Grupa: Moderatorzy
Postów: 8 989
Pomógł: 1550
Dołączył: 8.08.2008
Skąd: Słupsk/Gdańsk




Prosiłem o wstawienie bbcode to nie zrobiłeś tego. Zamykam.
Go to the top of the page
+Quote Post

Closed TopicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 22.08.2025 - 20:06