1) Pobieram plik z internetu kopiujac kazdy znak fgetc i zapisuje do pliku
2) Konwertuje zakodowana strone w ISO-8859-2 na UTF-8 funkcja iconv
3) Szukam wzoru w znalezionym pliku i towrze tablice dopasowan preg_match_all
4) Kasuje niepozadane znaki takie jak spacje, ukosniki, pytajniki itp.. preg_replace
5) ucinam polskie ogonki wlasna funkcja
WYNIK: okazuje sie ze wszystko dziala w porzadku, wyswietla sie tak jak chce, otrzymuje ciag bez niepozadanych znakow z jednym wyjatkiem zawsze zostaje cudzyslow ", po prostu nie da sie go usunac. Moze wie ktos dlaczego?
uzywalem roznych wzorow $wzor = '/[\"]+/'; $wzor = '/[\x22]+/'; $wzor = '/["]+/'; jednak nic nie skutkuje. Ponizej umiesczam skrocona do minimum wersje programu. Może ktos mnie wyratuje z problemu...
<?php $wzor = '/[\"]+/'; $zrzut = SavePHPasTXT (); for ($i=0 ;$i<count($zrzut2[0]) ; $i++){ $zrzut3[$i]=pllib_cut2 ($zrzut2[0][$i]); } function pllib_cut2 ($ciag) { for ($i=0 ; $i<count($l_PL) ; $i++) return $ciag; } function SavePHPasTXT () { $zrzut=''; $zrzut = $zrzut.$znak; } $zrzut=iconv("ISO-8859-2","UTF-8",$zrzut); return $zrzut; } ?>
problem rozwiązany pomogła linijka (w kodzie był również błąd, ale tylko w pliku testowym w 10 linii powinno być $zrzut3[$i]=pllib_cut2 ($zrzut3[$i]);)
Rozwiązanie:
CODE
$zrzut=str_replace ( " & q u o t e ; ","\"",$zrzut);