sebap123
17.07.2011, 20:13:27
Mam dosyć dziwny problem z kodowaniem między stroną, a bazą danych MySQL. W bazie mam zapisane dwa rekordy: nazwa i skrót. Nazwa jest podawana przez użytkownika, a skrót jest generowany automatycznie przez skrypt (pobiera on pierwsze trzy znaki i sprawdza, czy taki skrót istnieje - jeśli tak to dopisuje cyfrę).
Wszystko odbywa się przy pomocy zwykłego formularza. Po wysłaniu i wygenerowaniu skutu pojawia się potwierdzenie zawierające nazwę i wygenerowany skrót. Potem jest to zapisywane do bazy i wyświetlana jest lista zwierająca nazwę i odpowiadający jej skrót.
I tutaj pojawia się mój problem. Nazwa zawsze, jest poprawnie wyświetlana (zawiera polskie znaki), a skrót nie - zawsze ma znak zapytania w rombie zamiast polskich znaków. Sprawdzałem w bazie, i tam zarówno nazwa jak i skrót wpisują się z krzaczkami zamiast polskich liter, ale wszelkie sprawdzenia, porównania itp. dokonywane na bazie zawsze są poprawne. Jak już mówiłem, wyświetlanie nazwy na stronie jest zawsze poprawne - zawsze znaczy i w momencie wyświetlenia potwierdzenia jak i listy, dlatego to co się dzieje w bazie średnio mnie niepokoi bo wynik nazwy mam poprawny.
Parę info dot. mojej strony i środowiska programistycznego, może to kogoś na coś naprowadzi:
- używam systemu szablonów smarty ze zdefiniowanym kodowaniem utf-8
- na wszystkich stronach html jest zdefiniowany meta-tag kodowania utf-8
- pliki tpl są tworzone w notepad++ z kodowaniem utf-8
- piszę w NetBeans, który ma odgórne kodowanie plików utf-8
Tak więc już nie wiem co jest nie tak, z tym skrótem, a przyznaje, że jest to rzecz, która mnie już bardzo irytuje. Może ktoś ma jakiś pomysł, jak ten problem rozwiązać? Jeśli coś jeszcze mam sprawdzić to napiszcie.
YaQzi
17.07.2011, 20:24:13
To co jest wpisywane z poziomu formularza musi być tak samo zinterpretowane w drugą stronę. Ale skoro przy wysyłaniu z kodu coś nie tak to gdzieś tego utf-8 brakuje... A przy połączeniu z bazą danych masz ustalanie kodowania?
Tylko jak będziesz sprawdzał to wrzuć najpierw kilka rekordów bo to ma wpływ też na inserty.
lobopol
17.07.2011, 20:25:19
A jak skracasz, znając życie używasz substr zamiast mb_substr
morbic
17.07.2011, 20:25:38
Zaraz po mysql_connect:
Odsyłam do tego tematu:
Temat: MYSQL Polskie znaki//Edit: Poprawiony link, dzięki
@toaspzoo
toaspzoo
17.07.2011, 20:29:46
php header<meta ...Cytat(morbic @ 17.07.2011, 21:25:38 )

Zaraz po mysql_connect:
<!--Geshi:283079:php--><pre class="php-brief" style="font-family:monospace;"><div class="head">[PHP]
110402 Pusto !
sebap123
17.07.2011, 20:45:45
@lobopol: nie używam żadnej funkcji wbudowanej, tylko traktuje napis jako tabelę znaków.
@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.
@toaspzoo: sory, ale nie rozumiem o co Ci chodzi.
toaspzoo
17.07.2011, 20:57:15
Cytat(sebap123 @ 17.07.2011, 21:45:45 )

@lobopol: nie używam żadnej funkcji wbudowanej, tylko traktuje napis jako tabelę znaków.
@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.
@toaspzoo: sory, ale nie rozumiem o co Ci chodzi.
Pozwolę sobie napisać kolorem
czerwonym - LINK NIEPRAWIDŁOWY!
YaQzi
17.07.2011, 20:57:29
Cytat(sebap123 @ 17.07.2011, 21:45:45 )

@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.
Ale jak wstawiłeś 'SET NAMES' to dodałeś nowe rekordy czy sprawdzałeś na starych? Bo na starych będzie Ci cały czas bugować bo masz w dwóch kolumnach różne kodowanie.
toaspzoo
17.07.2011, 20:58:32
Link morbic'a jest nieprawidłowy
lobopol
17.07.2011, 21:00:48
Cytat(toaspzoo @ 17.07.2011, 21:58:32 )

Link morbic'a jest nieprawidłowy

Genialnie 4 raz już tego nie pisz.
sebap123
17.07.2011, 21:01:55
@toaspzoo: dzięki, już to sprawdziłem
@YaQzi: tak dodałem owe rekordy przy utf-8 i nadal to samo, a wręcz gorzej, bo obcina krzaki na wyświetlaniu.
YaQzi
17.07.2011, 21:02:27
Cytat(toaspzoo @ 17.07.2011, 21:58:32 )

Link morbic'a jest nieprawidłowy

Zamiast marudzić na 3 posty to być poprawił.

Bo id tematu w linku jest.
Link poprawiony.
morbic
17.07.2011, 21:08:54
A jakie kodowanie ma tabela i pola w niej?
sebap123
18.07.2011, 06:54:09
Poprawiłem już kodowanie tabeli i bazy przy pomocy instrukcji z tego artykułu o MySQL. Teraz w bazie nie mam już krzaczków, jak i na stronie przy wywołaniu. Jednak cały czas coś jest nie tak, a mianowicie ucina mi trzeci znak jeśli w skrócie pojawia się polski znak, lub pokazuje znak zapytania w rombie ( nie wiem jeszcze do końca od czego to zależy).
W czasie tworzenia skrótu, pierwszy znak przy pomocy funkcji strtolower jest zamieniany na małą literę, jednak jeśli jest to polski znak, to już ta funkcja nie chce go zmienić. Tak więc, niby coś się poprawiło, ale niedużo, bo nadal nie mam tego czego chciałem, tyle tylko, że teraz ładniej mi się wyświetla wszystko w bazie.
Aha, zapomniałem dodać, że jak ręcznie dopiszę polski znak w tabeli to w podglądzie na stronie już się dobrze wyświetla.
thek
18.07.2011, 08:20:01
A czytałeś, że funkcje stringowe działają kiepsko z polskimi znakami, ponieważ bazują na iso-8859-1, a nie iso-8859-2? Tutaj musisz używać funkcji uniwersalnych dla kodowań wielobajtowych, a więc tych z przedrostkiem mb_ lub zrobić sobie mapowanie przy konwersji.
sebap123
18.07.2011, 09:29:55
@thek:
No szczerze powiedziawszy, to przeczytałem to w manualu, ale nie do końca nie wiedziałem o co chodzi. Dzięki za info. Rzeczywiście wystarczyło zamienić ta funkcję, plus dokonać paru konwersji i tyle. Wielkie dzięki za to info.
Teraz mam tylko jeszcze jedno pytanie dot. długości napisów. Jak już mówiłem, skrót wykonuję, traktując nazwę, jako tablicę znaków i pobieram trzy pierwsze znaki, a jeśli już taki skrót istnieje dopisuję jeszcze dwa - . i 1. Jeśli nadal istnieje dodaje 1 do ostatniego znaku i tak aż do skutku. Jednak, jeśli w napisie występuje polski znak, to zajmuje on dwie pozycje w tabeli. Czy może ktoś mi poradzić, jak to obejść, żeby można było zrobic tak jak napisałem, również na ciągach z polskimi znakami?
thek
18.07.2011, 10:33:55
Używaj wciąż funkcji mb_ to będziesz wiedział, bo istnieje także
mb_strlen, która zlicza dobrze wyrazy z polskimi znakami, a do cięcia jest
mb_substr teraz jedynie file_exist i jazda w stylu
if( mb_strlen( $nazwa_pliku ) > 2 ) { //sprawdzamy czy nazwa pliku ma 3 lub więcej znaków
$skrot = mb_substr( $nazwa_pliku, 0, 3 ); //wycinamy 3 pierwsze
if( !file_exists( $skrot ) ) { //sprawdzamy czy istnieje for($i = 1; :$i++) { //jesli nie to nieskończona pętla zwiększająca licznik o 1 co przebieg by tworzyć SKR.1, SKR.2, SKR.3
if( !file_exists( $skrot.'.'$i ) ) { //sprawdzamy czy testowany skrót istnieje $skrot = $skrot.'.'$i; //jeśli nie to wpisujemy go jako znaleziony...
break; //... i wychodzimy z nieskończonej pętli
}
}
}
} else {
//przewidziałeś, że nazwa pliku będzie krótsza niż 3 znaki? :)
}
oczywiście dopasować to musisz sam do swojego skryptu, ja tylkoCi w komentaarzach do kolejnych instrukcji napisałem na co zwrócić uwagę. z pętlą for( $i=1; ;$i++) musisz uważać. Dawno tego nie używałem i powinno działać w nieskończoność aż do instrukcji break, ale nie jestem pewien czy php przyjmował ten zapis z pominięciem czy w końcu sobie odpuścili

Jeśli sypnie Ci tam błędem to daj dowolny warunek zawsze prawdziwy w miejsce pustki, czyli przykładowo for( $i=1; true; $i++)
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę
kliknij tutaj.