Post
#1
|
|
|
Grupa: Zarejestrowani Postów: 119 Pomógł: 0 Dołączył: 19.01.2008 Ostrzeżenie: (0%)
|
Mój skrypt pobiera informacje z wpisanego w inpucie adresu.
Za pomocą curla i wyrażeń regularnych a także, get_meta_tags. I teraz mam problem, mój serwis jest w kodowaniu UTF-8, baza danych wszędzie: utf8_unicode_ci Przy wyciąganiu np danych z onet.pl albo interia.pl pojawiają się sławne krzaczki, albo w ogóle obcina ciąg i nie dodaje do bazy całości. Jako że mój serwis ma być elastyczny nie mogę sobie zrobić po prostu:
Bo wtedy strony które są w kodowaniu UTF-8 się sypią. Próbowałem zdziałać coś funkcją mb_detect_encoding, jeżeli chodzi o UTF-8 to odczytuje kodowanie poprawnie, ale np iso-8859-2 już nie odczytuje więc problem występuje nadal. Macie jakieś propozycje? może ja coś źle kminię (IMG:style_emoticons/default/smile.gif) |
|
|
|
![]() |
Post
#2
|
|
|
Grupa: Zarejestrowani Postów: 226 Pomógł: 61 Dołączył: 20.08.2010 Ostrzeżenie: (0%)
|
Przeglądarka też nie potrafi magicznie rozpoznać kodowania strony. Najpierw sprawdza, czy podane jest kodowanie w nagłówku Content-Type (tak jak na onecie). Jeżeli nie jest podane, to sprawdza tag <meta> (tak jak na interii). Jeżeli tam też nie ma podanego kodowania, to przeglądarka ustawia domyślne.
Sprawdzaj tak samo u siebie. |
|
|
|
Reptile ReX PHP/MYSQL/Curl Kodowanie 20.01.2011, 12:25:21
vermis Możesz pobrać tę informację z metatagów na stronie... 20.01.2011, 12:58:42
Reptile ReX Nie zawsze w nagłówkach jest określone z kodowanie... 20.01.2011, 13:01:48 ![]() ![]() |
|
Aktualny czas: 27.12.2025 - 19:31 |