Problem z konwersją nieznanych kodowań na UTF8 w bazie SQLITE

Problem z konwersją nieznanych kodowań na UTF8 w bazie SQLITE

nowy_pehapowiec Zobacz profil	18.11.2009, 13:08:12 Post #1
Grupa: Zarejestrowani Postów: 220 Pomógł: 0 Dołączył: 24.08.2009 Ostrzeżenie: (0%)	Dostałem bazę danych w której dane były wpisane w różnych kodowaniach. Część w językach europejskich a cześć w azjatyckich, przy czym teksty powinny zawierać tylko znaki łacińskie. Teksty z bazy są wyświetlane przy użyciu kodowania utf8 ale na niektórych komputerach w miejscach spacji albo przecinków pojawiają się krzaki. Czyli muszę teraz przekonwertować wszystkie wpisy w bazie na utf8. Ale nie znam kodowań źródłowych, część jest w UTF8, cześć w GB2312, część w różnych wersjach ISO (np iso-8859-1). W dodatku bazą jest SQLITE, która, ponoć domyślnie używa UTF8. Jak zamienić to kodowanie nie uszkadzając tekstów? Przejrzałem funkcje z pakietu multibyte ale nie działają w 100% dobrze. Jakieś pomysły? pozdrawiam Ten post edytował nowy_pehapowiec 18.11.2009, 13:21:53

Odpowiedzi

wookieb Zobacz profil	19.11.2009, 12:05:37 Post #2
Grupa: Moderatorzy Postów: 8 989 Pomógł: 1550 Dołączył: 8.08.2008 Skąd: Słupsk/Gdańsk	Trochę pomyślunku. Przecież napisałeś, że znasz przynajmniej 3 kodowania znaków a to JUŻ DUŻO INFORMACJI. Podałem ci jak masz użyć mb_detect_encoding, której podajesz jaki drugi argument KODOWANIA JAKIE ZNASZ (przykład masz nawet w manualu). Przeleć po tych ciągach i zobacz dla których funkcja mb_detect_encoding nie jest w stanie wykryć kodowania, olejesz je i potem pokombinujesz jakie to może być kodowanie (np pozgadywać). Dla tych których wykryło odpowiednie kodowanie użyć iconv [PHP] pobierz, plaintext $ciag = iconv($WYKRYTE_KODOWANIE_PRZEZ_MB, 'utf-8', $ciag); [PHP] pobierz, plaintext I zapisujesz ten ciąg w bazie. Pach masz kodowanie utf-8.

Posty w temacie

nowy_pehapowiec Problem z konwersją nieznanych kodowań na UTF8 w bazie SQLITE 18.11.2009, 13:08:12

wookieb Pokaż jak używałeś funkcji z multibyte. Co prawda ... 18.11.2009, 13:21:21

nowy_pehapowiec Najpierw sprawdziłem jakie jest kodowanie: echo mb... 19.11.2009, 10:33:54

wookieb Jak używasz mb_detect_encoding to używaj jej z dru... 19.11.2009, 10:51:52

nowy_pehapowiec wookieb ale problem w tym, że ja nie wiem jakie po... 19.11.2009, 11:05:55

wookieb Trochę pomyślunku. Przecież napisałeś, że znasz pr... 19.11.2009, 12:05:37

nowy_pehapowiec mb nie wykrywa żadnego kodowania poprawnie. Kodowa... 19.11.2009, 13:22:41

wookieb Wrzuć tą tabelę do jakieś pliku i wystam. Mogę się... 19.11.2009, 13:39:17

nowy_pehapowiec Udało mi się ustalić, że w tekście są jednocześnie... 20.11.2009, 12:56:48

Zyx Istnieje możliwość takiego sprawdzenia. Sekwencje ... 25.11.2009, 10:31:02

nowy_pehapowiec Zyx Twoje rozwiązanie jest super, ale ma dużą wadę... 25.11.2009, 14:05:49

2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Przełącz na: Standardowy · Przełącz na: Linearny+ · Drzewo

Aktualny czas: 28.12.2025 - 18:01

Hosting zapewnia

Forum PHP.pl