Post
#1
|
|
|
Grupa: Zarejestrowani Postów: 89 Pomógł: 7 Dołączył: 19.05.2008 Ostrzeżenie: (0%)
|
Pytanie: jak dobrać się do pliku rss który publikuje interia?
plik: http://kanaly.rss.interia.pl/turystyka.xml problem: kodowanie pliku to UTF-8, ale znalazły się w nim słowackie znaki które w UTF już niestety nie są. Do tej pory używałem:
Co dało błędy:
Więc spróbowałem:
No i błąd:
Błąd ominąłem w simplexml_load_string:
i otrzymałem
Czy ktoś ma większe doświadczenie w kodowaniach? Zależy mi na tym aby tekst był czytelny, słowackie znaki mogą być wykrzaczone. Wszelka pomoc mile widziana. Ten post edytował taktu 26.12.2009, 19:30:21 |
|
|
|
![]() |
Post
#2
|
|
|
Grupa: Zarejestrowani Postów: 1 332 Pomógł: 294 Dołączył: 12.10.2008 Skąd: Olkusz Ostrzeżenie: (0%)
|
skoro wiesz jakie to kodowanie ma być to pozostaje Ci tylko je wymusić - możesz to zrobić na 2 sposoby, krótkim kodem a mało wydajnym który odradzam tylko wskazuję drogę do przemyśleń:
lub idea taka sama aczkolwiek kod dłuższy i w sumie pozostawi się encje dla innych znaków - w niczym w końcu to nie przeszkadza:
jednak jeszcze zamiast funkcji file_get_contents radziłbym używać curl'a z włączoną opcją gzip coby mniej na łączu było transferu lub fsockopen - tyle, że tutaj trzeba sprawdzać jeszcze nagłówki przychodzące i jeśli jest skompresowane gzip'em to samemu dekompresować... |
|
|
|
taktu [XML] DOM i SimpleXML 26.12.2009, 19:29:02
byqu Spróbuj konwertować polskie znaczki według ich zap... 26.12.2009, 20:14:34
taktu Ciekawy pomysł ale niestety nie pomoże, znaki któr... 27.12.2009, 13:29:19
taktu Dzięki za odpowiedź, rzeczywiście zadziałało tak j... 27.12.2009, 17:50:58 ![]() ![]() |
|
Aktualny czas: 29.12.2025 - 02:34 |