Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Wydajność wyszukiwarki w PHP i MySQL, 12k plików x 4k wyrazów + 2k plików rocznie
MGL
post
Post #1





Grupa: Zarejestrowani
Postów: 1
Pomógł: 0
Dołączył: 10.11.2013

Ostrzeżenie: (0%)
-----


Witam,

Chciałbym się dowiedzieć o wasze opinie na pewien temat:

Mam 12k plików, po średnio 4k wyrazów, chciałbym zrobić witrynę wyszukującą frazy i słowa w tych plikach. (baza będzie się powiększać ok 2000 plików rocznie, dane nie będą aktualizowane w czasie rzeczywistym - tylko ręcznie, raz dziennie)

Myślałem nad przeniesieniem wszystkich plików (jako tekstu lub html) do bazy MySQL i zrobieniu wyszukiwarki w PHP, tu pojawia się moja wątpliwość co do wydajności tego rozwiązania.

1. Czy zapytania fulltext w MySQL na hostingu będą działać w sposób wystarczająco szybki?
2. Czy powinienem już użyć np. Sphinxa, a w takim wypadku czy i jak Sphinx będzie współpracował z serwerem VPS?
3. Myślałem również nad rozwiązaniem pośrednim tzn. tworzenie indeksu offline (napisaną aplikacją na zwykłym PC) i uploadowanie go do MySQL, co uważać o takim sposobie?

Będę wdzięczny za każdą sugestię.
Go to the top of the page
+Quote Post
Crozin
post
Post #2





Grupa: Zarejestrowani
Postów: 6 476
Pomógł: 1306
Dołączył: 6.08.2006
Skąd: Kraków

Ostrzeżenie: (0%)
-----


FTS wbudowany w MySQL spokojnie powinien sobie z tym poradzić. Zresztą, zawsze możesz później skorzystać ze Sphinksa, posiada on dobrą integrację z MySQL-em.
Go to the top of the page
+Quote Post
ano
post
Post #3





Grupa: Zarejestrowani
Postów: 435
Pomógł: 40
Dołączył: 16.02.2003
Skąd: Wrocław

Ostrzeżenie: (0%)
-----


Zależy jakie chcesz uzyskać featuresy w swojej wyszukiwarce.
12k plików - są to pdfy/docx? Jeśli tak to technologie oparte na Lucene ułatwią Ci proces ich indeksowania - automatyczna ekstrakcja tekstu z plików.

Jeśli chcesz mieć np wyszukiwanie fasadowe, polską odmianę słów, jakieś ciekawe filtry przy indeksowaniu/odpytywaniu to tego MySQL Ci nie zapewni.

Pamiętaj też, że w miarę sensowny fulltextsearch zaczyna się od mysql 5.6 - wcześniej nie wspierał go silnik InnoDB (jedynie MyIsam). A o wadach myisam radzę osobno poczytać ;-)

Więc:
- na mysql pewnie się uda, ale będziesz zawsze nim ograniczony
- na Solr/Spinhx uzyskasz o wieeele większe możliwości


--------------------
Linkedin | ...
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 20.08.2025 - 11:44