(Nie)Eleganckie zapytanie tablicowe.

(Nie)Eleganckie zapytanie tablicowe., Prośba o pomoc w sformułowaniu zapytania…

Morfina Zobacz profil	27.02.2014, 09:44:21 Post #1
Grupa: Zarejestrowani Postów: 14 Pomógł: 0 Dołączył: 4.09.2013 Ostrzeżenie: (0%)	Witam, Mam problem w odpytaniu Bazy danych w sposób „elegancki”, już tłumaczę o co chodzi. Dane: (IMG:http://imageshack.com/a/img827/9602/ncvm.jpg) Zadanie: Wyszukaj pracowników zarabiających najmniej na danym etacie. Rozwiązanie, którego bym oczekiwał i uważam za eleganckie powinno mieć postać: SELECT nazwisko FROM pracownicy WHERE ( Etat , Placa_pod ) IN (SELECT Etat, MIN(Placa_pod) FROM pracownicy GROUP BY etat); Niestety nie działa ono na MS SQL. Rozwiązanie, które działa ale jest wg. mnie gorsze (nieeleganckie) ma postać: SELECT dbo.Pracownicy.Nazwisko, dbo.Pracownicy.Imie FROM dbo.Pracownicy INNER JOIN (SELECT MIN(Placa_Pod) AS Min, Etat FROM dbo.Pracownicy AS Pracownicy_1 GROUP BY Etat) AS P_1 ON dbo.Pracownicy.Placa_Pod = P_1.Min AND dbo.Pracownicy.Etat = P_1.Etat Czy któryś z szanownych forumowiczów ma pomysł na rozwiązanie bez użycia JOIN ? Z góry dziękuję Morf. Witam ponownie, po nocnych przemyśleniach: SELECT Nazwisko, Imie FROM dbo.Pracownicy AS T1 WHERE (Placa_Pod = (SELECT MIN(Placa_Pod) AS Low FROM dbo.Pracownicy WHERE (Etat = T1.Etat))) Poziom elegancji 7 / 10 i dodatkowy punkcik za bark JOIN czyli 8 /10 :-) w zasadzie jest OK chyba, że... Pozdrawiam Morf

Odpowiedzi

pmir13 Zobacz profil	28.03.2014, 14:22:54 Post #2
Grupa: Zarejestrowani Postów: 282 Pomógł: 89 Dołączył: 12.04.2011 Ostrzeżenie: (0%)	Z odpowiednimi indeksami rozwiązanie klasyczne jest wystarczająco szybkie dla stosunkowo niedużej bazy danych, a zapewne taka jest baza pracowników, bo nawet biorąc pod uwagę wszystkich zatrudnionych na naszych uczelniach pracowników mielibyśmy ilość rekordów rzędu 100k, a to jest liczba, którą może obsłużyć testowy serwer postawiony na leciwym laptopie. Oczywiście zakładając prawidłowe zaindeksowanie, bo bez indeksów nawet przy tej niewielkiej ilości danych serwer może się zmęczyć. Dopiero gdy dane idą w miliony trzeba myśleć o rozwiązaniach dedykowanych dla silnika i wykorzystujących specyfikę rozkładu danych, mówiąc wcześniej o takim rozwiązaniu dla sql servera z wykorzystaniem CTE i CROSS APPLY chodziło mi o coś w tym stylu: [SQL] pobierz, plaintext WITH etaty AS ( SELECT MIN(etat) AS etat FROM pracownicy UNION ALL SELECT eo.etat FROM ( SELECT p.etat, ROW_NUMBER() OVER (ORDER BY p.etat) AS nr_etatu FROM etaty e JOIN pracownicy p ON p.etat > e.etat WHERE e.etat IS NOT NULL ) eo WHERE eo.nr_etatu = 1 ) SELECT pd.* FROM etaty e CROSS APPLY ( SELECT TOP 1 pr.* FROM pracownicy pr WHERE pr.etat = e.etat ORDER BY placa_pod, id ) pd OPTION (MAXRECURSION 0) [SQL] pobierz, plaintext Czyli wykorzystanie rekurencji CTE do szybkiego znalezienia z indeksu wszystkich różnych etatów a następnie CROSS APPLY by w zależnym podzapytaniu móc umieścić własne TOP i ORDER BY, dzięki czemu dostajemy dla każdego etatu wykorzystując ten sam indeks najniższą płacę, co przy dość zaawansowanym optymalizatorze sql servera pozwala uniknąć pełnego skanu indeksu (a skan całej tabeli to w ogóle byłby horror), a zamiast tego szukamy tylko tyle ile mamy różnych etatów ( czyli w miarę ograniczona, można nawet założyć stała ilość - nawet O(log(N)) jest przecież dużo gorsze niż O(1)). Polecam do testowania na nieco większej bazie, dla ułatwienia: [SQL] pobierz, plaintext CREATE TABLE pracownicy ( id INT NOT NULL PRIMARY KEY, nazwisko VARCHAR(64), imie VARCHAR(64), etat VARCHAR(16), placa_pod DECIMAL(20,2) ) GO CREATE INDEX etat_placa_id ON pracownicy( etat, placa_pod, id ); GO BEGIN TRANSACTION DECLARE @i INT SET @i = 1+FLOOR(RAND(1)) WHILE @i < 10000000 BEGIN INSERT INTO pracownicy( id, nazwisko, imie, etat, placa_pod ) VALUES( @i, 'Nazwisko_'+CAST(@i AS VARCHAR(9)), 'Imie_'+CAST(@i AS VARCHAR(9)), 'Etat_'+CAST(FLOOR(RAND()100)+1 AS VARCHAR(3)), (FLOOR(RAND()300000+100000))/100 ) SET @i = @i+1; END COMMIT [SQL] pobierz, plaintext Mamy tutaj 10M losowych rekordów dla 100 różnych etatów i prawidłowy indeks, z trzecim członem dla ewentualnego rozstrzygania remisów w płacach wg najniższego id. Samo tworzenie tabeli zajmuje kilka-kilkanaście minut na starym kompie, ale zapytanie wciąż pozostaje w obszarze milisekund. Dla porównania klasyczne rozwiązanie powinno trwać kilka sekund.

Posty w temacie

Morfina (Nie)Eleganckie zapytanie tablicowe. 27.02.2014, 09:44:21

thek Nie pamiętam czy pod MSSQL to działa, ale czy aby ... 3.03.2014, 10:40:03

fizzlebubble Lekko przyofftopuję... Coś te dane wyglądają znajo... 3.03.2014, 10:50:06

widmo_91 Cytat(thek @ 3.03.2014, 10:40:03 ) Ni... 3.03.2014, 10:53:24

Morfina Cytat(fizzlebubble @ 3.03.2014, 10:50... 4.03.2014, 13:16:04

pmir13 Po raz pierwszy słyszę by ktoś uznawał rozwiązanie... 4.03.2014, 15:14:03

juris Nie ma co gdybać co jest bardzie a co mniej wydajn... 12.03.2014, 09:16:34

Morfina Cytat(pmir13 @ 4.03.2014, 15:14:03 ) ... 13.03.2014, 16:41:32

juris Masz jakieś indeksy na tej tabeli? Możesz podrzuci... 14.03.2014, 09:12:05

Morfina Cytat(juris @ 14.03.2014, 09:12:05 ) ... 15.03.2014, 08:34:13

mmmmmmm Różnica w czasach może wynikać ze statystyk i cach... 15.03.2014, 14:09:16

juris Zrób tak - na początku każdego zapytania DBCC DROP... 17.03.2014, 09:13:13

pmir13 Z odpowiednimi indeksami rozwiązanie klasyczne jes... 28.03.2014, 14:22:54

juris @pmir13 Bardzo mi się podoba Twoje podejście i to ... 31.03.2014, 09:07:51

Morfina Dziękuję wszystkim uczestniką dyskusji, muszę przy... 3.04.2014, 09:06:36

« Następny starszy · Microsoft SQL Server / MSDE · Następny nowszy »

1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Forum PHP.pl