Post
#1
|
|
|
Grupa: Zarejestrowani Postów: 119 Pomógł: 0 Dołączył: 19.01.2008 Ostrzeżenie: (0%)
|
Mój skrypt pobiera informacje z wpisanego w inpucie adresu.
Za pomocą curla i wyrażeń regularnych a także, get_meta_tags. I teraz mam problem, mój serwis jest w kodowaniu UTF-8, baza danych wszędzie: utf8_unicode_ci Przy wyciąganiu np danych z onet.pl albo interia.pl pojawiają się sławne krzaczki, albo w ogóle obcina ciąg i nie dodaje do bazy całości. Jako że mój serwis ma być elastyczny nie mogę sobie zrobić po prostu:
Bo wtedy strony które są w kodowaniu UTF-8 się sypią. Próbowałem zdziałać coś funkcją mb_detect_encoding, jeżeli chodzi o UTF-8 to odczytuje kodowanie poprawnie, ale np iso-8859-2 już nie odczytuje więc problem występuje nadal. Macie jakieś propozycje? może ja coś źle kminię (IMG:style_emoticons/default/smile.gif) |
|
|
|
![]() |
Post
#2
|
|
|
Grupa: Zarejestrowani Postów: 119 Pomógł: 0 Dołączył: 19.01.2008 Ostrzeżenie: (0%)
|
Nie zawsze w nagłówkach jest określone z kodowanie.
Ma ktoś jakiś inny pomysł? czy zostaje mi tylko preg_match ? Co do zgody to jedyne dane jakie są pobierane to: Title, Keywords oraz description. Więc raczej nie naruszam żadnych praw autorskich. Ten post edytował Reptile ReX 20.01.2011, 13:17:42 |
|
|
|
Reptile ReX PHP/MYSQL/Curl Kodowanie 20.01.2011, 12:25:21
vermis Możesz pobrać tę informację z metatagów na stronie... 20.01.2011, 12:58:42
Noidea Przeglądarka też nie potrafi magicznie rozpoznać k... 20.01.2011, 14:57:09 ![]() ![]() |
|
Aktualny czas: 27.12.2025 - 22:14 |