Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Dopasowanie produktów do kategorii
Dyzma
post 2.04.2018, 10:44:26
Post #1





Grupa: Zarejestrowani
Postów: 13
Pomógł: 1
Dołączył: 2.04.2018

Ostrzeżenie: (0%)
-----


Cześć,

1. Mam drzewiastą strukturę kategorii w bazie ~3000 rekordów. Agreguję produkty z różnych stron za pomocą xml z tym że nie są to spójne pliki i wymagają dopasowania produktu do kategorii.
Czasami jest to forma "kategoria/subkategoria/subkategoria", innym razem po prostu "kategoria". Myślałem o wykorzystaniu ElasticSearch, do dopasowania po nazwie? Co sądziecie o takim rozwiązaniu? Może ktoś z was ma lepszy patent jak mapować takie produkty. Jestem świadomy że, nie da się tego uniwersalizować, bo raz jest to breadcrumbs a innym razym razem sama nazwa, lecz chciałbym się skupić na samym dopasowaniu.

2. W dockerze testowałem także operację na tabelach, mianowicie na tabeli ~5mln rekordów, chciałem dodać klucz obcy, zapytanie wykonywało się kilka godzin. Czy to jest normalne zachowanie? Czy może ktoś posiada jakieś ciekawe artykuły jak pracować z dużymi bazami danych.

3. Jak w praktyce wygląda korzystanie z uuid zamiast numerycznego id.

Ten post edytował Dyzma 2.04.2018, 10:48:08
Go to the top of the page
+Quote Post
www.aukcje.fm
post 3.04.2018, 11:52:01
Post #2





Grupa: Zarejestrowani
Postów: 173
Pomógł: 1
Dołączył: 4.05.2010

Ostrzeżenie: (20%)
X----


1) Z doświadczenia wiem że trzeba ręcznie (nawet użycie Levensteina nic nie daje, jedynie wyłapuje literówki to samochody znajdą się np w zabawkach). Zwykłe użycie %like% a potem wiele rekordów do przejrzenia i poprawek lub od początku budowanie powiązań na stałe.

2)No kilka godzin to mega długo. To już zalezy od serwera czyli od szybkości dysku na którym jest baza, prędkości pojedynczego wątku (gdyż tego rodzaju operacje w mysql są obsługiwane na 100% w jednym wątku nawet jak się ma ich kilkanaście).

3) Jakiego rodzaju masz tabele innodb czy Mylsam? UUID to 16 bajtowa liczba, jej zapis szesnastkowy oddzielony myślnikami wg wzorca: 4B -2B - 2B - 2B - 6B. Ja używam zwykłych ID autonumerowanych nawet w wielomilionowych tabelach, lub są to inne klucze nie unikalne bez głownego, aczkolwiek czasami kluczem jest np tytuł jeżeli wiem że jest unikalny.
Go to the top of the page
+Quote Post
Dyzma
post 3.04.2018, 12:46:30
Post #3





Grupa: Zarejestrowani
Postów: 13
Pomógł: 1
Dołączył: 2.04.2018

Ostrzeżenie: (0%)
-----


1. Trochę dużo danych żeby to robić ręcznie, myślałem o mapowaniu kategori dla każdego xml-a z importem, ale to także mnóstwo pracy, bo jednak każdy sklep może mieć różne kategorie w swojej bazie. Co prawda i tak mniej pracy niż przy ręcznym przeklepywaniu każdego produtku.

3. To było pytanie czysto teoretyczne, osobiście korzystam z Postgres. Chciałem wiedzieć jak baza zachowuje się przy dużej ilości rekordów, jak wygląda to rozmiarowo itp. Przeglądając Gthub zauważyłem że mnóstwo aplikacji opartych o DDD właśnie korzysta z uuid.
Go to the top of the page
+Quote Post
ZenekN
post 4.04.2018, 06:50:33
Post #4





Grupa: Zarejestrowani
Postów: 418
Pomógł: 5
Dołączył: 7.08.2012

Ostrzeżenie: (0%)
-----


Mysle ze jestes na tyle poczatkujacy ze wyobrazasz sobie to inaczej, uwiez mi wszyscy segreguja recznie (lub na samym poczatku recznie a potem z elasticsearch) tak robi olx i inne wieksze portale stanowisko pracy nazywa sie PRODUCT MANAGER sprawdz ile jest ofert.

Ten post edytował ZenekN 4.04.2018, 08:21:39
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 28.03.2024 - 13:14