Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Kodowanie znaków
ujex
post
Post #1





Grupa: Zarejestrowani
Postów: 51
Pomógł: 1
Dołączył: 4.11.2006

Ostrzeżenie: (0%)
-----


Piszę bo skończyły mi się pomysły:(
Do wyszukiwarki na mojej stronie prowadzą skądś (nie wiem skąd) dziwne linki. Zamiast polskich znaków są jakieś krzaczki.
Zrobiłem tablicę w php żeby je zmieniać na polskie odpowiedniki:
  1. $_search = Array ("ďż˝","Ć","Ĺš","Ĺź","Ăł","Ĺ‚","ś","ć","Ä™","Ĺş","Ĺ›","Ä…","Ăł","ĹĽ","Ĺ‚","Ĺş","Ĺ›","Ĺ„","ł","Ä„","ł","Ĺť","Ĺƒ","Ă“","Ä‚ł");
  2. $_replace = Array ("ó", "ć", "ś", "ż", "ó", "ł", "ś","ć", "ę", "ź", "ś", "ą", "ó", "ż", "ł", "ź", "ś", "ń", "ł","ą", "ł", "ż", "ń", "ó", "ó");

Jednak jak już widać w tych tablicach jednemu polskiemu znakowi odpowiada kilka krzaków. Nie jest to chyba rozsądne rozwiązanie, żeby ciągle dopisywać nowe jak się pojawią tym bardziej że znalazłem takich niedziałających linków już kilka tysięcy.
Pojawiają się jeszcze bardziej dziwne, np:
Kod
http://example.com/szukaj/zajĹĂŻÂżÃ‚Ë+cie+w+ciÄĂŻÂżÃ‚Ë+ĹźÃ„ĂŻÂżÃ‚Ë++na+urlopie+bezpĹĂŻÂżÃ‚Ë+atnym/


Dodam, że te linki pochodzą z internetu gdzieś musiały się zaindeksować niestety nie potrafię tego zlokalizować. Najczęściej wywoływane są przez googlebot i Yahoobot.
Jest jakiś sposób na przekonwertowanie tego na polskie znaki.
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 5)
uirapuru
post
Post #2





Grupa: Zarejestrowani
Postów: 182
Pomógł: 9
Dołączył: 30.04.2005

Ostrzeżenie: (0%)
-----


jakie masz kodowanie na stronie/serwerze/bazie ? odpytania sa raczej w utf8 (strzelam, ale pewnie tak)
Go to the top of the page
+Quote Post
ujex
post
Post #3





Grupa: Zarejestrowani
Postów: 51
Pomógł: 1
Dołączył: 4.11.2006

Ostrzeżenie: (0%)
-----


Cała strona jest w utf-8
Baza tak samo:
  1. SET NAMES utf8
Go to the top of the page
+Quote Post
uirapuru
post
Post #4





Grupa: Zarejestrowani
Postów: 182
Pomógł: 9
Dołączył: 30.04.2005

Ostrzeżenie: (0%)
-----


może formularz przesyła do serwera w innym kodowaniu? nie jesteś w stanie pewnie odtworzyć sam problemu, spróbuj rozpoznać kodowanie i zalogować razem z frazą na serwerze. ja bym tak próbował, bo nic mi innego nie przychodzi do głowy. (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post
ujex
post
Post #5





Grupa: Zarejestrowani
Postów: 51
Pomógł: 1
Dołączył: 4.11.2006

Ostrzeżenie: (0%)
-----


No właśnie próbowałem tak, przez miesiąc próbowałem wyłapać te krzaki z tablicy.
Sprawdzałem frazy wpisane w formularz i osobno linki prowadzące do wyszukiwarki.
Krzaki były tylko w linkach nie zdarzył się ani jeden po wpisaniu w formularz, stąd mój wniosek że są one gdzieś w internecie i linkują do strony.
Go to the top of the page
+Quote Post
uirapuru
post
Post #6





Grupa: Zarejestrowani
Postów: 182
Pomógł: 9
Dołączył: 30.04.2005

Ostrzeżenie: (0%)
-----


raczej obstawiałbym, że boty przeszukują Twoją strone na wypadek popularnych fraz poprzez formularz wyszukiwania, ale tu musiałby wypowiedzieć się jakiś specjalista. loguj headery wywołań, może to cos z ustawieniami serwera. nie wypowiadam się, bo nie znam się (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 24.08.2025 - 10:04