Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Pytanko dot. wyciagana z tresci :pp
Forum PHP.pl > Forum > PHP
crackcomm
Witam mam zamiar zrobic bota ktory chodzi po sronach file get contentsm wyciaga adresy do serverow do jednej malo znanej gry, nie bede podawal nazwy ;pp
adresy wygladaja tak :
stronaxssd:asd.sd
oczywiscie to nie wyglada dokladni tak to tylko przyklad tongue.gif p
chcial bym bot wchodzil na strone file_get_contentsem i wyciagalo tylko te "adresy" i wyswietlalo je smile.gif
nie mam zielonego pojecia jak to zrobic (wiem tylko ze za pomoca preg_match_all)
Prosze o pomoc i przyklady
bim2
  1. <?php
  2. preg_match_all('!([a-zA-Z_-]+?):([a-zA-Z_-]+?).:([a-zA-Z_-]+?)!is', $file_get_contents, $matches);
  3. print_r($matches);
  4. ?>

Nie sprawdzałem, ale powinno działac.
crackcomm
sprawdze, a co do
tych wykrzyknikow na poczatku i przed is, czesto tez widzialem np. | to ma jakas roznice ?

niestety :
Array ( [0] => Array ( ) [1] => Array ( ) [2] => Array ( ) [3] => Array ( ) )
PawelC
to jest wyrażenie które sszuka linki na stronie
smile.gif
  1. <?php
  2. "(<a(?:.*?)?href=\"(.*?)\"(?:.*?)?>)si"
bim2
  1. <?php
  2. $file_get_contents = 'lolsfsdf:sdfsdf.pl ehhhh:fsdfsdf:sfsdf.pl';
  3. preg_match_all('!([a-zA-Z_-]+?):([a-zA-Z_-]+?).([a-zA-Z_-]{2})!is', $file_get_contents, $matches);
  4. foreach($matches[0] AS $value)
  5. {
  6. echo $value.'<br />';
  7. }
  8. ?>


Jeden ":" za dużo smile.gif

Co do wykrzykników, jest znak hmm "startu" i "końca" wyrażenia, po 2 wykrzykniku (znaku) daje się parametry. Mogłoby być tam i @ czy $ tongue.gif Ważne, że p obu stronach to samo.
crackcomm
nie pokazuje calych adresow ;/
Cytat
sdfs:sdfs
sdsdfsdf:dsdf
sdsdfsdfsdfsdf:sdfs

Cytat(ExPlOiT @ 9.03.2008, 11:28:28 ) *
to jest wyrażenie które sszuka linki na stronie
smile.gif
  1. <?php
  2. "(<a(?:.*?)?href=\"(.*?)\"(?:.*?)?>)si

mogl bys pokazac jak to zastotowac bo nic z tego nie rozumiem ;/
Cysiaczek
~bim2 już Ci pokazał, a ponoć to Ty masz zamiar zrobić bota. Pokaż zatem, co do tej pory zrobiłeś. Śmiem wątpić, że cokolwiek :/
PawelC
  1. <?php
  2. $file_get_contents = 'lolsfsdf:sdfsdf.pl ehhhh:fsdfsdf:sfsdf.pl';
  3. preg_match_all("(<a(?:.*?)?href=\"(.*?)\"(?:.*?)?>)si", $file_get_contents, $matches);
  4. foreach($matches[0] AS $value)
  5. {
  6. echo $value.'<br />';
  7. }
  8. ?>

z tym że musisz pobrać stronę aby Ci wyszukał linki, prostego bota który wyszukuje linki możesz zobaczyć tutaj:
exploitek.info/bot.php
crackcomm
nie zbyt to wychodzi
Cytat
<td class="leftMenuTxt"><div class="leftMenuTxtA"><a href=http://www.learn4good.com/board/1_1028_0.html>European School of E...</a><br/><a href=http://www.learn4good.com/board/10_3020_0.html>Drivers Ed Games</a><br/><a href=http://www.learn4good.com/board/3_3050_0.html>happy families resea...</a><br/><a href=http://www.learn4good.com/board/10_3048_0.html>Trukz online game</a><br/><a href=http://www.learn4good.com/board/7_3047_0.html>can anyone give me a...</a><br/><a href=http://www.learn4good.com/board/1_156_0.html>Au Pair Ireland in D...</a><br/><a href=http://www.learn4good.com/board/5_2737_0.html>What are you listeni...</a><br/><a href=http://www.learn4good.com/board/7_3046_0.html>Nanny/Caregiver Need...</a><br/><a href=http://www.learn4good.com/board/7_2926_0.html>Seeking Nanny in Wax...</a><br/><a href=http://www.learn4good.com/board/10_2136_0.html>bubble trouble</a><br/></div></td>

</tr>
</table>
</td>
<td valign="top"><table width="100%">
<tr>
<td width="15%" class="caption4">&nbsp; &nbsp; Author</td>
<td width="85%" class="caption4">&nbsp; &nbsp; Message</td>

</tr>
<tr valign=top class=tbCel1>

a co z ucinaniem linkow ?
probowalem zmienic na
Kod
preg_match_all('!([a-zA-Z_-]+?)@([a-zA-Z_-]+?).([a-zA-Z_-]+?)!is', $file_get_contents, $matches);
tez nic ;/
PawelC
Pobrane linki sobie przefiltruj i zapisz tylko te w których występuje mp. nazwa gry
crackcomm
hm dobry pomysl juz sie za to biore tongue.gif
i oczywiscie "synonimy"
ale co mi po tym jak nie da sie wyciagnac adresow servow ?
skrypt juz +- dziala
Kod
([a-zA-Z_-]+?):([a-zA-Z_-]+).([a-zA-Z_-]{2,5})

a jak np. jest
asdasd:asdsadas.asdasd.sdd to pokazuje tylko asdasd:asdsadas.asdasd
PawelC
a zobacz tak:
  1. <?php
  2. ([a-zA-Z_-]+?):([a-zA-Z_-]+).([a-zA-Z_-]+).([a-zA-Z_-]{2,5})
  3. ?>
crackcomm
probowalem ale to mi parsuje tez nastepne slowo
np;
asdasd:asdd.asds zapraszam
jezeli nie ma drogiego . w adresie
a jak jest to normalnie wywietla
bim2
  1. <?php
  2. $file_get_contents = 'lolsfsdf:sdfsdf.pl ehhhh:fsdfsdf:sfsdf.pl witaj adres:costam.lolek';
  3. preg_match_all('!([a-zA-Z_-]+?):([a-zA-Z_-]+?).([a-zA-Z_-]{0,5})!is', $file_get_contents, $matches);
  4. foreach($matches[0] AS $value)
  5. {
  6. echo $value.'<br />';
  7. }
  8. ?>

daje
Cytat
lolsfsdf:sdfsdf.pl
fsdfsdf:sfsdf.pl
adres:costam.lolek


Chyba o to chodziło smile.gif

btw. Poprawiłem wyrażenie
crackcomm
niestety ucina ;/
zamiasta np
Cytat
sdsadas:asasd.sss
jest
Cytat
sdsadas:asasd.ss
PawelC
Mi przy tym kodzie:
  1. <?php
  2. $file_get_contents = 'sdsadas:asasd.asds ehhhh:fsdfsdf:sfsdf.sdsd';
  3. preg_match_all('!([a-zA-Z_-]+?):([a-zA-Z_-]+?).([a-zA-Z_-]{0,5})!is', $file_get_contents, $matches);
  4. foreach($matches[0] AS $value)
  5. {
  6. echo $value.'<br />';
  7. }
  8. ?>

Wyświetla:
  1. sdsadas:asasd.asds
  2. fsdfsdf:sfsdf.sdsd
crackcomm
napisz na gg 10498189
bim2
GG jest od gadania... skopiuj kod jeszcze raz (z tego 2 posta). Na 100% będzie działać i mi nie ściemniaj, bo 2 osobą działa, a tobie się chyba sprawdzić nie chce.
crackcomm
dziala
ale czasem adrsy wygladaja tez tak :
sfsdfsdf:sdfdf.sdfsdf.sdfsdf
czyli maja dwie kropki
PawelC
Cytat
sfsdfsdf:sdfdf.sdfsdf.sdfsdf

A adresy stron tak
  1. http:\\www.adres.pl

zmień sobie tak aby po dwykropku były \\ i będzie wszystko grało
crackcomm
adresy severow sa czasem na subdomenach tak jakby np.
lol@poczta.onet.pl
tak samo sa servery tylko ze zamiast "@" jest ":"
np.
nazwa:subdomena.domena.pl
Przypominam ze czasem sa tez bez subdomeny a chce zeby mi parsowalo all smile.gif
bim2
A nie możesz pierw wyciągnąć wszystkich adresów a później sprawdzić czy jest : w linku? smile.gif
crackcomm
k zrobilem wykorzystalem source WP biggrin.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.