Forum PHP.pl > [art] php i Memcached

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [art] php i Memcached

Forum PHP.pl > Inne > Oceny

Riklaunim

25.01.2007, 22:13:38

Napisałem artykuł opisujący możliwości zastosowania memcached z poziomu php

Link: php i Memcached

Testów wydajnościowych jeszcze nie robiłem ale mam w planach

nrm

25.01.2007, 23:01:24

najs, to porównaj to wtedy do wykorzystania PDO z keszem do pliku (serializacja). Mam wrażenie, że ten drugi sposób jest równie wydajny a przyjemniejszy w użyciu (jeżeli chodzi o cache zapytań). chętnie obejrzałbym wyniki takich testów.

Riklaunim

25.01.2007, 23:02:58

RAM jest szybszy od I/O na dysku i dodatkowo serializacją/deserializacją

ale trochę testów będzie.

nrm

25.01.2007, 23:17:46

teoretycznie tak

praktycznie to różnie bywa. jak pisałem wyżej: daj znać jak będziesz robił testy, pewnie będą bardzo ciekawe.

Bastion

26.01.2007, 12:09:46

Po pierwsze - po co to kiedy jest shmop http://pl.php.net/manual/pl/ref.shmop.php

Po drugie - większe prawdopodobieństwo, że firma hostingowa zgodzi się zainstalować
oryginale rozszerzenie, które jest razem z php poprzez --enable-shmop, niż zajmie się
instalacją rozszerzeń "trzecich", w dodatku wymagających dziwnych, mało znanych zależności
typu :

- konieczność posiadania libevent
- konieczność posiadania serwera cache memcached
- wymagana opbsługa epol w jądrze - z małym ale jądra 2.4 tego nie mają - trzeba więc je patchować

Po trzecie - serwer memcached musi byc uruchomiony w tle ( uruchomiona przez użytkownika )
więc wypada mieć shella - wyjątek stanowi, praca jako użytkownik nobody , uruchomiona przez admina.

Po czwarte, brak możliwości hashowania nazwy klucza pod jakim ma być zapisany nasz cachowany obiekt,
skutkuje to tym, że każdy będzie mogł odczytać zawartość cache, znając tekstowy klucz. Dodatkowo więc
wypadałoby napisać aggregato, który będzie zamieniał nam nasze klucze tworząc unikatowy hash.

Po piąte, łączenie się z serwerem cache, nawet po localhoscie jest wolniejsze niż odczyt z dysku metodą
unserialize(file_get_contents(....));

Po szóste, cache obiektów, zapytań SQL - w ogóle nie ma sensu z zasadniczych powodów

- obsługa FS w php i tak jest cacheowana (duża więc wydajność sama w sobie odczytu danych z dysku)
~~- podbnie zapytania SQL w bazach MySQL i podobnych równie jest cachowana~~

Po siódme, wyniki mówią same za siebie :

Testowi poddałem 32kB plik tekstowy zawierający tekst Lorem Ipsum (48 linii), plik należało pobrać do tablicy
i poddać procesowi cachowania.

Na ogień poszły 3 metody

1) Na dysku twardym poprzez unserialize(file_get_contents())
2) Używając rozszerzenia SHMOP z wykorzystaniem klasy Class5.Mnemonic
3) Używając rozszerzenia MemCache

Test 2 i 3 wykonano dwoma sposobami - 1 sposób to jednokrotna inicjacja obiektu, 2 sposób wielokrotna inicjacja obiektu

Jak przechowano dane :

[PHP] pobierz, plaintext 
<?php
 
	require_once('../libs/class5.mnemonic.php');
 
	$lorem_ipsum = file('lorem.txt');
 
	// Cache Mnemonic
	$cache = new Mnemonic();
	$cache -> store('lorem', $lorem_ipsum);
 
	$memcache = new MemCache();
	$memcache -> connect('localhost', 11211);
	$memcache -> set('lorem', $lorem_ipsum, false);
 
	// Cache Traditional
	file_put_contents('cache/lorem.cache', serialize($lorem_ipsum));
 
?>
[PHP] pobierz, plaintext

Jak testowano :

[PHP] pobierz, plaintext 
<?php
 
	require_once('../libs/class5.mnemonic.php');
 
	$passes	= 3;
	$iteration = 1000;
 
	$s = microtime(true);
	$cache = new Mnemonic();
	for ($j = 0; $j < $passes; $j++)
	{
		for ($i = 0; $i < $iteration; $i++)
		{
			$wynik = $cache -> get('lorem');
		}
	}
	echo 'Class5.Mnemonic (SHMOP Extension) #1 : '.((microtime(true)-$s)/$passes).'<br />';
 
	$s = microtime(true);
	for ($j = 0; $j < $passes; $j++)
	{
		for ($i = 0; $i < $iteration; $i++)
		{
			$cache = new Mnemonic();
			$wynik = $cache -> get('lorem');
		}
	}
	echo 'Class5.Mnemonic (SHMOP Extension) #2 : '.((microtime(true)-$s)/$passes).'<br />';
 
	$s = microtime(true);
	$memcache = new Memcache();
	$memcache -> connect('localhost', 11211);
	for ($j = 0; $j < $passes; $j++)
	{
		for ($i = 0; $i < $iteration; $i++)
		{
			$wynik = $memcache -> get('lorem');
		}
	}
	$memcache -> close();
	echo 'Memcache #1 : '.((microtime(true)-$s)/$passes).'<br />';
 
	$s = microtime(true);
	for ($j = 0; $j < $passes; $j++)
	{
		for ($i = 0; $i < $iteration; $i++)
		{
			$memcache = new Memcache();
			$memcache -> connect('localhost', 11211);
			$wynik = $memcache -> get('lorem');
			$memcache -> close();
		}
	}
	echo 'Memcache #2 : '.((microtime(true)-$s)/$passes).'<br />';
 
	$s = microtime(true);
	for ($j = 0; $j < $passes; $j++)
	{
		for ($i = 0; $i < $iteration; $i++)
		{
			$wynik = unserialize(file_get_contents('cache/lorem.cache'));
		}
	}
	echo 'file_get_contents Unserialize : '.((microtime(true)-$s)/$passes).'<br />';
 
 
?>
[PHP] pobierz, plaintext

Wyniki :

Cytat

Class5.Mnemonic (SHMOP Extension) #1 : 0.15039666493734
Class5.Mnemonic (SHMOP Extension) #2 : 0.12634968757629
Memcache #1 : 0.22323632240295
Memcache #2 : 0.55660033226013
file_get_contents Unserialize : 0.090231021245321

Jak widać Memcache wypadł najgorzej... można powiedzieć okropnie.

Jednak jest sens wykorzystania pamięci , ale nie w takim obrazie jak przedstawiono,
sens jest , gdy jednocześnie cacheujemy znaczne ilości danych, ale nie jakby się mogło
wydawać rozmiarowo ( kilka plików po kilkaset kB ), a setki/tysiące plików po kilkaset bajtów
lub parę kilobajtów. Jak wiadomo przewagą jest tu czas dostępu I/O ( czyli mam na myśli
tworzenie, kasowanie, odczytywanie, modyfikacja ). Dlatego sensem jest cachowanie
np. systemów szablonów, warstw danych, lub umieszczanie w pamięci shared memory
(memcached tego nie umożliwia), źródeł skryptów php.

Wtedy wyniki prezentują sie nieco odmiennie

Cytat

IO test on 5000 files
IO Result of Regular Directory : 1.1335179805756 seconds
IO Result of Class5.Mnemonic : 0.37275409698486 seconds

IO test on 10000 files
IO Result of Regular Directory : 2.5350189208984 seconds
IO Result of Shared Memory Directory : 0.91874718666077 seconds

Przykładem może być jak już wspomniałem umieszczenie w pamięci podręcznej
nie tyle co tylko szablonów TPL i kompilatów, ale także samych klas.

Cytat

Testing Chameleon 2.1.4 + Mnemonic => 359.57 requests/s
Testing OPT 1.1.0 => 160.29 requests/s
Testing Smarty 2.6.16 => 96.01 requests/s

i tradycynie z dyku ::

Cytat

Testing Chameleon 2.1.4 => 192.57 requests/s
Testing OPT 1.1.0 => 85.54 requests/s
Testing Smarty 2.6.16 => 56.01 requests/s

Na zakończenie parę uwag odnośnie artykułu :

1) extension=memcache.so a nie extension=memcached.so
2) nie napisałeś nic o instalacji serwera memcached oraz libevent
3) brak informacji o wymaganiu jadra 2.6 lub 2.4 z odpowiednia lata

To tyle

Pozdro.

nrm

26.01.2007, 12:26:48

Bastion brawo

Na ciebie zawsze można liczyć

Żenua ale pierwszy raz słyszę o Shmop ?!? Coś ze mną nie tak, czy to jest tak mało znane/popularne?

Niezgodze się tylko z jednym:

Cytat

Po szóste, cache obiektów, zapytań SQL - w ogóle nie ma sensu z zasadniczych powodów

to tzw. bullshit

czyli chrzanienie

Ma sens i to ogromny!!! Pokeszuj sobie różne głupie pytania (tzn. takie których nie trzeba wyciagać za każdym razem np. lista kategorii) na serwisie, który ma tysiące uników na godzinę

Ja tak zrobiłem i nagle obciążenie dedyka spadło _bardzo mocno_ a praca dysków nie wykazała zauważalnych zmian.

Bastion

26.01.2007, 12:34:26

Nie przeglądamy manuala dla relaksu co ?

http://pl.php.net/manual/pl/ref.shmop.php

co do SQL *teraz* nie przeczę - uwaga była wysunięta na podstawie mojego doświadczenia, opartego
widać na mniejszych serwisach

wybacz ! ;]

nrm

26.01.2007, 12:42:38

ta, linka widziałem wyżej, już przejrzałem choć niewiele tam tego. Poogoglam sobie później w tym temacie. A manuala dla relaksu zdecydowanie nie przeglądam

Co do cache sql: należy też pamiętać o tym, że na ogół to (my)sql najbardziej obciąża serwer* przy sporym ruchu, zamiana tysięcy pytań do sqla na tysiące wczytań zserializowanej do pliku tablicy przy dyskach scsi w raidzie okazuje się zbawienna dla całego serwera.

* szczególnie teraz w dobie web2.0, serwisów społecznościowych, OGROMU informacji które ciągnie się z bazy, kilka razy więcej sqli na stronę :/ eh, masakra. Najgorsze jest to, że większości z nich skeszować się nie da :/

Riklaunim

26.01.2007, 13:00:37

tutaj jest prezentacja (PDF) dotycząca rails i memcached

Autor opisuje po co, kiedy i do czego powinno używać się memcached.

Odnośnie sensu keszowania - memcached nie jest dla małych i średnich stron. Memcached jest dla slashdotów, wikipedii czy diggów, gdzie można sobie postawić nawet kilka serwerów memcached. Odnośnie keszowania wyników zapytań to nie keszuje się prostych a jedynie te skomplikowane łączące table z różnymi warunkami i zwracające wiele danych. Na mniejszą skalę można sobie keszować do plików w katalogu [z podmontowanym tmpfs]

Bastion

26.01.2007, 13:11:14

<joke>Tylko co ma rails do php

</joke>

A na poważnie, zgadzam się z sensem stosowania cache w dużych projektach, cacheująć spore, powiązane ze sobą zapytania.
Nie mniej jednak już na samych różnicach I/O widać że SHMOP jest szybszy i bardziej dostępny niż MemCached. Powiedzmy,
że zmylił mnie artykuł, wyglądający jak coś do małych rzeczy.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.