Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [XML] DOM i konwersja z UTF-8 do ISO-8859-2
spyro
post
Post #1





Grupa: Zarejestrowani
Postów: 13
Pomógł: 0
Dołączył: 21.03.2008

Ostrzeżenie: (0%)
-----


Witam.

Moja aplikacja bazuje na UTF-8. Baza danych w UTF-8, wszystkie pliki językowe w UTF-8. Wszystko jest pięknie i ślicznie. Zero problemów z polskimi znakami.

Jednakże, pojawiła się konieczność eksportu niektórych danych do XML, który musi mieć encoding w ISO-8859-2. Do tego celu wybrałem DomDocument, ponieważ na pierwszy rzut oka dobrze radził on sobie z konwersją no i zachowuje zasady obiektowości.

Niestety plik XML został odrzucony przez importującego dane. Podany powód: zbyt duża ilość znaków w jednym z tagów. Zliczając znaki ich ilość była zgodna z dokumentacją, dlatego dobrałem się HexEditorem do wyeksportowanego pliku.

Okazało się, że polskie znaki zapisywane są na dwóch bajtach i wyglądają, jak te z UTF-8.

Próbowałem ręcznie konwertować plik XML zwrócony jako string (metodą DomDocument::saveXML()) metodą mb_convert_encoding, ale w wyniku otrzymuję (niezależnie od podanego kodowania w parametrze tej funkcji) string kodowany w ASCII, czyli bez polskich znaków.

Pytanie: Jak poprawnie zwrócić plik XML posiadający jeden bajt na polski znak, poprawnie zakodowany w ISO-8859-2?

PS. Ustawiam nagłówek XML i kodowanie:
  1. header("content-type: text/xml; charset=ISO-8859-2");


Z góry dziękuję za pomoc!
Go to the top of the page
+Quote Post
nospor
post
Post #2





Grupa: Moderatorzy
Postów: 36 557
Pomógł: 6315
Dołączył: 27.12.2004




Ja do konwersji uzywam http://pl2.php.net/manual/en/function.iconv.php


--------------------

"Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista
"Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer

Go to the top of the page
+Quote Post
zegarek84
post
Post #3





Grupa: Zarejestrowani
Postów: 1 332
Pomógł: 294
Dołączył: 12.10.2008
Skąd: Olkusz

Ostrzeżenie: (0%)
-----


mb_convert_encoding -> Supported Character Encodings


--------------------
Jeśli twoja ręka rusza do przodu powstrzymaj swój gniew; gdy wyprzedza cię twój gniew - wycofaj rękę.

Go to the top of the page
+Quote Post
spyro
post
Post #4





Grupa: Zarejestrowani
Postów: 13
Pomógł: 0
Dołączył: 21.03.2008

Ostrzeżenie: (0%)
-----


Jak już napisałem, te metody nie dziełają (mb_convert_encoding oraz iconv).

Cytat(spyro @ 11.01.2011, 11:26:57 ) *
Próbowałem ręcznie konwertować plik XML zwrócony jako string (metodą DomDocument::saveXML()) metodą mb_convert_encoding, ale w wyniku otrzymuję (niezależnie od podanego kodowania w parametrze tej funkcji) string kodowany w ASCII, czyli bez polskich znaków.

Go to the top of the page
+Quote Post
nospor
post
Post #5





Grupa: Moderatorzy
Postów: 36 557
Pomógł: 6315
Dołączył: 27.12.2004




Cytat
Jak już napisałem
Pisales tylko o jednej smile.gif
Mi tam iconv zawsze dzialalo. Moze źle cos robisz. Pokaz lepiej caly kod


--------------------

"Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista
"Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer

Go to the top of the page
+Quote Post
spyro
post
Post #6





Grupa: Zarejestrowani
Postów: 13
Pomógł: 0
Dołączył: 21.03.2008

Ostrzeżenie: (0%)
-----


iconv się wysypuje (prawdopodobnie dlatego, że ten string jakoś jest już magicznie przekonwertowany winksmiley.jpg )

Kod:
  1. public function render($element=Null)
  2. {
  3. // Jeśli w konfiguracji ustawiony jest przełacznik czyszczenia bufora wyjściowego:
  4. if(Core::config('xml.clean_output'))
  5. {
  6. // Oczyść bufor wyjściowy:
  7. }
  8.  
  9. if(Core::config('xml.set_header'))
  10. {
  11. header("content-type: ".Core::config('xml.content_type')."; charset=".Core::config('xml.encoding'));
  12. }
  13.  
  14. // Jeśli wygenerowany plik DOM ma być przesłany do ściągnięcia:
  15. if(Core::config('xml.force_download'))
  16. {
  17. header('Content-Disposition: attachment; filename="'.Core::config('xml.filename').'";');
  18. }
  19.  
  20.  
  21. return is_null($element) ? $this->document->saveXML() : $this->document->saveXML($element);
  22. }



Bład przy iconv:

Nieobsługiwany PHP Error: iconv() function.iconv: Detected an illegal character in input string w pliku application/controllers/export.php w lini 169

Ten post edytował spyro 11.01.2011, 15:36:37
Go to the top of the page
+Quote Post
zegarek84
post
Post #7





Grupa: Zarejestrowani
Postów: 1 332
Pomógł: 294
Dołączył: 12.10.2008
Skąd: Olkusz

Ostrzeżenie: (0%)
-----


mało próbujesz, mało kodu pokazujesz itd... pokazujesz kod, piszesz o iconv oraz mb_... a w kodzie nic nie ma... symbole możesz także pozamieniać na encje np. albo za pomocą wskazanego mb_convert_encoding albo np. za pomocą mb_encode_numericentity - nie podałeś w zasadzie nawet kodu konwersji tylko metodę w której wysyłasz nagłówki wymuszające download oraz zwracasz wartość tego xml'a...


--------------------
Jeśli twoja ręka rusza do przodu powstrzymaj swój gniew; gdy wyprzedza cię twój gniew - wycofaj rękę.

Go to the top of the page
+Quote Post
spyro
post
Post #8





Grupa: Zarejestrowani
Postów: 13
Pomógł: 0
Dołączył: 21.03.2008

Ostrzeżenie: (0%)
-----


Oj, był ten kawałek kodu. Zjadło go podczas edycji postu. Jakieś dziwne krzaki się pokazują zamiast kodu i nie można zapisywać posta, dlatego musiałem dodać na nowo cały kod. Zapomniałem o najważlniejszym:
  1. echo mb_convert_encoding($Dom->render(), 'ISO-8859-2', 'UTF-8');


Podsumowując:

1. Buduję DomDocument ustawiając kodowanie i wersję:
  1. new DOMDocument('1.0', 'ISO-8859-2')

2. Tworzę węzły wg danych pobranych z bazy (baza w UTF-8).
3. Renderuję plik XML na ekran, wysyłając przy tym odpowiednie nagłówki.
4. Zwrócony dokument w postaci string próbuję przekonwertować za pomocą iconv lub mb_convert_encoding. Jednakże, mb_convert_encoding usuwa polskie znaki i string zawiera tylko znaki ASCII. Iconv zaś powiadamia mnie błędem, że napotkał na nieznany znak.

Ten post edytował spyro 11.01.2011, 16:40:42
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 21.08.2025 - 10:08