Forum PHP.pl

Forum PHP.pl > Forum > Przedszkole

[PHP]Wyszukiwanie w pliku logu

Qwer Zobacz profil	26.12.2009, 19:46:21 Post #1
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 15.09.2009 Ostrzeżenie: (0%)	Witam, mam plik logu pewnej gry, przykładowa linijka wygląda tak: [30 Nov 11:53:09] PARTY [Caelldfssion] jakiś tam tekst no i mam takie pliki utworzone przez siebie: dictionary.txt (słownik) o przykładowej zawartości: .kur. (na razie jeden wyraz) oraz channels.txt (schematy kanałów do przeglądania) i przykładowej zawartości: ^\[.. ... ..:..:..\] PARTY \[.\] ^\[.. ... ..:..:..\] ALL [\[.\] ^\[.. ... ..:..:..\] ALLIANCE \[.\] ^\[.. ... ..:..:..\] TRADE \[.\] ^\[.. ... ..:..:..\] HERO_VOICE \[.\] i teraz sedno problemu... stworzyłem skrypt, który niestety nie działa i bardzo obciąża sprzęt bo wyszukuje w 30MB pliku (około 400000 linijek) i dla każdej jest odpowiednia ilość kombinacji wyszukiwania, dla w/w plików jest to 5^1 kombinacji (5), skrypt wygląda tak jak kod poniżej, jeżeli ktoś ma pomysł jak to dobrze rozwiązać aby działało i nie obciążało aż tak sprzętu to prosiłbym o pomoc skrypt: [PHP] pobierz, plaintext <?php $channels=file('channels.txt'); $dictionary=file('dictionary.txt'); $file=fopen('chat.log', 'r'); $search; $founded; $k=0; for ($i=0; $i<sizeof($channels); $i++){ for ($j=0; $j<sizeof($dictionary); $j++){ $search[$k]=trim($channels[$i])." ".trim($dictionary[$j]); $k++; } } while(!feof($file)){ $row=fgets($file); for($i=0; $i<sizeof($search); $i++){ if (preg_match("/$search[$i]/i", $row)){ if (sizeof($founded) != 0){ $founded[sizeof($founded)+1]=$row; } else { $founded[0]=$row; } } } } for($i=0; $i<sizeof($founded); $i++){ echo $founded[$i]."<br>"; } ?> [PHP] pobierz, plaintext wcześniej wczytałem cały 30MB plik do tablicy funkcją file() i nie było to dobre rozwiązanie, także obciążało, stąd chciałem przesiąść się na to, ale jak widać nieskutecznie. W kodzie mogą być drobne błędy jednak całość powinna być w miarę dobrze zrozumiana. Z góry dziękuję za pomoc. Ten post edytował Qwer* 26.12.2009, 19:49:09

Start new topic

Odpowiedzi (1 - 4)

Pilsener Zobacz profil	27.12.2009, 00:51:45 Post #2
Grupa: Zarejestrowani Postów: 1 590 Pomógł: 185 Dołączył: 19.04.2006 Skąd: Gdańsk Ostrzeżenie: (0%)	1. To, co ma być znalezione wrzucasz do tablicy: [PHP] pobierz, plaintext $slownik = file('plik.txt'); [PHP] pobierz, plaintext - file, lub korzystając z while + feof + fgets 2. Następnie parsujesz plik: [PHP] pobierz, plaintext $uchwyt = fopen($pliczek,'r'); while(!feof($uchwyt)){ ++$licznik; $linia = rtrim(fgets($uchwyt))); foreach($slownik as $line){ $line2 = rtrim($line); if(strstr($linia,$line2)){ $znaleziono = 1; break; } } if($znaleziono==1){ echo 'znaleziono '.$line2.' w '.$linia.', wiersz pliku nr '.$licznik; //tu podejmiesz jakąś akcję po znalezieniu i pętla kończy działanie break; } } fclose($uchwyt); [PHP] pobierz, plaintext - pisane z palca, więc może nie działać. Zakładam, że jak w słowniku masz np. słowo CIUL a wiersz pliku zawiera "Pozdrawiam Was CIULE" to ma to znaleźć. Jeśli mają to być jakieś skomplikowane wyrażenia regularne etc. to trzeba pokombinować z takimi funkcjami: http://pl2.php.net/manual/pl/function.preg-grep.php

Qwer Zobacz profil	27.12.2009, 10:34:26 Post #3
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 15.09.2009 Ostrzeżenie: (0%)	feof()+fgets() użyłem teraz, wcześniej użyłem też file() czyli wczytania do tablicy całego pliku i wtedy porównywania jednak, oba rozwiązania są kiepskie ponieważ plik ma jakieś 400000 linijek co należy pomnożyć przez ilość kombinacji dla każdej (ilość kanałów razy ilość wyrazów). Strasznie obciąża kompa i na koniec się wysypuje. Chyba że użyłeś czegoś co zapobiegnie takiemu obciążeniu, jeżeli tak i możesz to proszę opisz mniej więcej jak chciałeś to zrobić, z góry dzięki. To co ma być znalezione także jest wrzucone do tablicy, robi to pierwsza pętla, łączy plik kanałów z plikiem słownika. przykładowe wyrażenie do znalezienia po połączeniu tylko jednego kanału z tylko jednym wyrazem: ^\[.. ... ..:..:..\] PARTY \[.\] .kur.* Ten post edytował Qwer 27.12.2009, 10:39:12

Pilsener Zobacz profil	27.12.2009, 16:55:36 Post #4
Grupa: Zarejestrowani Postów: 1 590 Pomógł: 185 Dołączył: 19.04.2006 Skąd: Gdańsk Ostrzeżenie: (0%)	Jeżeli to ma być wyrażenie regularne to na pewno nie będzie szybkie, w swoim kodzie użyłem optymalnego przeszukiwania stringu do znalezienia w nim pierwszego wystąpienia szukanej frazy zamiast pregmatch, użyłem pętli foreach zamiast for, rtrim zamiast trim i zrezygnowałem z count, która nie wiem po co znalazła się w Twoim kodzie. By działało szybciej proponuję porcjować to, co ma być wyszukiwane, zacząć od pliku z 1 szukanym wyrażeniem i sprawdzić jak działa i dopasować liczbę wyrażeń do możliwości serwera. Innej możliwości nie widzę.

Qwer Zobacz profil	27.12.2009, 19:29:36 Post #5
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 15.09.2009 Ostrzeżenie: (0%)	Dzięki za pomoc, mój skrypt już działa, błąd polegał na tym, że drugie wyrażenie regularne było źle sformułowane (drugi kanał) stąd się wysypywał, dalej jednak znacznie obciąża kompa, z czasem może i nad tym pomyślę rozpracowując to co podałeś i wykorzystując do swoich potrzeb, dzięki.

« Następny starszy · Przedszkole · Następny nowszy »

Reply to this topic

Start new topic

2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Przełącz na: Standardowy · Linearny+ · Przełącz na: Drzewo

Śledź ten temat · Wyślij temat na e-mail · Wydrukuj ten temat · Subskrybuj to forum

Aktualny czas: 12.03.2026 - 16:39

Powered By IP.Board © 2026 IPS, Inc.
All changes by PHP.pl Administrators

Hosting zapewnia

NQ.pl hosting, trac, svn