Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Problem z odczytywaniem plików MsDoc
vegito
post 29.08.2018, 14:54:53
Post #1





Grupa: Zarejestrowani
Postów: 9
Pomógł: 0
Dołączył: 27.02.2018

Ostrzeżenie: (0%)
-----


Witam, mam problem z odczytaniem plików .doc a dokładniej z działaniem polskich znaków.
Próbuję na dwa sposoby:
1. Pierwszy to biblioteka PhpOffice, gdzie niestety po napisaniu funkcji do odczytu otrzymuję sporo krzaczków.
2. Poniższa funkcja do konwersji z doc do stringa

  1. public function read_doc($filename) {
  2.  
  3. if ( file_exists($filename) ) {
  4.  
  5. if ( ($fh = fopen($filename, 'r')) !== false ) {
  6.  
  7. $headers = fread($fh, 0xA00);
  8.  
  9. $n1 = ( ord($headers[0x21C]) - 1 );
  10. $n2 = ( ( ord($headers[0x21D]) - 8 ) * 256 );
  11. $n3 = ( ( ord($headers[0x21E]) * 256 ) * 256 );
  12. $n4 = ( ( ( ord($headers[0x21F]) * 256 ) * 256 ) * 256 );
  13.  
  14. $textLength = ($n1 + $n2 + $n3 + $n4);
  15. $extracted_plaintext = fread($fh, $textLength);
  16.  
  17. //$content = nl2br($extracted_plaintext);
  18.  
  19. $outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/", "" , $extracted_plaintext);
  20. $content = str_replace("\r", "<br>", $outtext);
  21.  
  22.  
  23. return $content;
  24.  
  25. }
  26.  
  27. }
  28. }


Przy pierwszej metodzie dodanie linii $outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/", "" , $extracted_plaintext);
powoduje że krzaczki znikają jednak polskie znaki z nimi również.

Ktoś kiedyś miał podobny problem? Nie mogę znaleźć innych skryptów do tego typu zadań.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 23.04.2024 - 12:37