Forum PHP.pl

Forum PHP.pl > Forum > Bazy danych > MySQL

Reply to this topic

Start new topic

Określenie kolejnych ID, których brakuje., Gdy pole PK ma ustawione AUTOINCREMENT

Sephirus Zobacz profil	9.02.2012, 19:22:59 Post #1
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	Witam (IMG:style_emoticons/default/wink.gif) Mam ciekawy problem (wydajnościowy) Muszę sprawdzać integralność danych tabeli (Czy ktoś czegoś nie usunął nie pozamieniał itd)... Tabela ma strukturę: Kod ID (PK + AI) \| pole1 \| pole2 \| .... Jednym z wymogów jest wykrywanie czy w tabeli czasem nie ma "dziur". Co rozumiem przez dziurę: Jeśli mamy rekordy o id 1,2,3,4,5,6,7,8,9,... to jest wszystko ok. Ale jeśli mamy 1,2,3,5,6,7,8,9,... (brakuje 4) to jest problem - rekord 4 został usunięty. I teraz o co chodzi: Czy ktoś zna wydajny sposób na określenie tego, że w tej tabeli brakuje właśnie rekordu numer 4. Czyli chodzi mi o dowolny skrypt/funkcje/pomysł (najlepiej w samym SQL), który zwracałby w takim konkretnym przypadku "4". Zaznaczam że samo wykrycie dziur (że są) nie jest problemem wystarczy pobrać AUTOINCREMENT i policzyć wiersze... i już wiemy czy są dziury czy nie - ale mi chodzi o określenie ID których brakuje... Oczywiście można pobrać wszystko i sprawdzać po kolei... ale ta tabela będzie spora a sprawdzanie ma się odbywać często... Bardzo proszę o pomysły i pomoc (IMG:style_emoticons/default/smile.gif)

nospor Zobacz profil	9.02.2012, 19:34:34 Post #2
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	[SQL] pobierz, plaintext SET @zm=0; SELECT idzm, roz FROM ( SELECT ID-@zm AS roz, (@zm+1) AS idzm, @zm:=ID FROM TABELA ORDER BY ID ASC ) podsel WHERE podsel.roz > 1 [SQL] pobierz, plaintext (IMG:style_emoticons/default/smile.gif)

Sephirus Zobacz profil	9.02.2012, 19:41:18 Post #3
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	Super to jest coś - to jest pomysł (IMG:style_emoticons/default/smile.gif) A jak z wydajnością tego przy paru mln rekordów? Wiem że to sama sobie baza zrobi i raczej nie powinno to zbyt długo trwać (IMG:style_emoticons/default/tongue.gif) Ale lepiej zapytać (IMG:style_emoticons/default/smile.gif)

nospor Zobacz profil	9.02.2012, 19:44:42 Post #4
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	No cóż.... baza musi te wszystkie miliony rekordów przelecieć, nie ma bata. Ile to zajmie? Nie wiem, wygeneruj milion rekordów i sprawdź. Sam chętnie się przekonam (IMG:style_emoticons/default/smile.gif) czekaj... własnie sprawdziłem to na swojej tabeli. Mam tam ponad 500tys rekordów. Czas trwania: 0.333 sekundy

Sephirus Zobacz profil	9.02.2012, 19:44:47 Post #5
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	OK dam znać - ale będę mógł dopiero jutro (IMG:style_emoticons/default/wink.gif) Dzięki za pomoc - w sumie jak się da to walnąć nawet bez procedury to będzie kozak (IMG:style_emoticons/default/wink.gif)

nospor Zobacz profil	9.02.2012, 19:46:13 Post #6
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	Jak pisałem dla pół miliona trwało to bardzo krótko. Procedura również tu przecież nie jest potrzebna. Bo i po co? Możesz to spokojnie na zwykłym zapytaniu wykonać

Sephirus Zobacz profil	9.02.2012, 20:02:26 Post #7
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	Hmm też się pokusiłem o to by sprawdzić, co prawda na mniejszej liczbie i znalazłem pewną przeszkodę (IMG:style_emoticons/default/smile.gif) w tabeli miałem: 2 3 4 5 6 7 8 9 10 13 14 15 .... Czyli bez 1,11,12 SELECT zwrócił: idzm roz 1 2 11 3 Czyli nie znalazł 12 (IMG:style_emoticons/default/tongue.gif) Ale w sumie możną ją wydedukować i obliczyć już w PHP na podstawie: 11 - różnica to 3 zatem kolejny rekord to 11+3=14 (należy jeszcze odjąć 2 bo zaczynaliśmy od SET @zm = 0;) Zatem z każdego zwróconego rekordu bierzemy zakres (od idzm do idzm+(roz-2)) Co da: idzm roz id 1 2 1 11 3 11,12 I to mi wystarczy w zupełności (IMG:style_emoticons/default/biggrin.gif) (IMG:style_emoticons/default/smile.gif) Dzięki!! Jutro napisze jak śmiga na bazie 5mln+ (IMG:style_emoticons/default/wink.gif)

nospor Zobacz profil	9.02.2012, 20:04:45 Post #8
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	Cytat Ale w sumie możną ją wydedukować i obliczyć już w PHP na podstawie No cóż... wierzyłem w ciebie i wiedziałem, że z tym "niesamowitym problemem" poradzisz już sobie sam (IMG:style_emoticons/default/tongue.gif)

kiciafu Zobacz profil	12.02.2012, 12:12:41 Post #9
Grupa: Zarejestrowani Postów: 52 Pomógł: 0 Dołączył: 11.05.2010 Ostrzeżenie: (0%)	Hej, Ja miałem podobny problem ale w inny sposób go rozwiązałem choć moje rozwiązanie raczej nie nada się przy 5mln wpisów ale przy małych seriach się sprawdza: 1. Sprawdzamy maksymalną wartość id jaka jest w tabeli w której są luki. 2. Tworzymy sobie tymczasową tabelę zawierającą id 3. Wypełniamy tabelę serią od 1 do max (przy 5mln to by trochę mogło zająć - u mnie pętla robiąca 100 000 insertów wykonuje się w 14s na słabym serwerze) 4. Stosujemy takie zapytanie: [SQL] pobierz, plaintext SELECT ID FROM seria WHERE id NOT IN (SELECT TABELA.ID FROM TABELA); [SQL] pobierz, plaintext Ten post edytował kiciafu 12.02.2012, 12:48:16

nospor Zobacz profil	13.02.2012, 10:44:57 Post #10
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	kiciafu jak sam słusznie zauważyłeś, Twoje rozwiązanie nie nadaje się dla dużych danych. Również stosowanie go do małych danych jest mało eleganckie. Bo i po co tworzyć dane tymczasowe, skoro nie trzeba (IMG:style_emoticons/default/smile.gif) @Sephirus i jak testy?

Sephirus Zobacz profil	15.02.2012, 12:07:59 Post #11
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	Na wstępie przepraszam, że dopiero teraz piszę... ale naprawdę mam "jumanji" w pracy i wyleciało mi w końcu z głowy (IMG:style_emoticons/default/tongue.gif) Co do twojej metody nospor... 1. Sprawdziliśmy ją porównawczo z innymi metodami znalezionymi gdzieś w sieci... rezultaty... W każdej próbie na różnych silnikach DB... twoja bije resztę będąc conajmniej 2x szybsza (IMG:style_emoticons/default/biggrin.gif) 2. Testy robiliśmy potem na dwóch silnikach MyISAM i InnoDB (z różnymi konfiguracjami indeksów, pól i samych dziur): - Na MyISAM po odpowiednich zabiegach konfiguracyjnych (by można było zrobić tak by sobie ta metoda działała "w tle") i obciążeniu metoda radziła sobie świetnie (IMG:style_emoticons/default/smile.gif) > 100mln rekordów (sporo pól i indeksów) - ~ 1,5 minuty (IMG:style_emoticons/default/smile.gif) - Na InnoDB (te same warunki) było nieco gorzej ale i tak wyśmienicie: > 100mln rekordów - ~ 4 minuty Tak więc reasumując (IMG:style_emoticons/default/smile.gif) Wielkie dzięki - o to chodziło (IMG:style_emoticons/default/biggrin.gif) Kubuś rządzi! ;P

nospor Zobacz profil	15.02.2012, 12:14:56 Post #12
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	100mln rekordów 1,5 minuty - nieźle (IMG:style_emoticons/default/smile.gif) InnoDB zawsze działa wolniej od MyISAM. Swoją drogą zawsze mnie to dziwiło czemu - skoro przelecenie po rekordach powinno mnie więcej tak samo szybkie niezależnie czy MyIsam czy InnoDB. Coś w tym InnoDB musieli skaszanić (IMG:style_emoticons/default/wink.gif) Mógłbyś pokazać inne rozwiązania, które znaleźliście? Ciekawi mnie, jak inaczej można było to załatwić.

Sephirus Zobacz profil	15.02.2012, 12:31:13 Post #13
Grupa: Zarejestrowani Postów: 1 527 Pomógł: 438 Dołączył: 28.06.2011 Skąd: Warszawa Ostrzeżenie: (0%)	Jedno się ostało jeszcze bo reszta poszła do śmieci od razu (IMG:style_emoticons/default/tongue.gif) To robi po prostu joina na tej samej tablicy i zwraca rekordy gdzie jest NULL w drugiej ;P sprytne ale wolniejsze ok 2x... [SQL] pobierz, plaintext SELECT a.id + 1 AS lost_id FROM tabela a LEFT JOIN tabela b ON a.id + 1 =b.id WHERE b.id IS NULL ORDER BY a.id [SQL] pobierz, plaintext A co do InnoDB to samo w sobie jest wolniejsze jakby porównać z MyISAM dla jednego procesu - zapis jest dużo wolniejszy itd... Wydaje mi się, że to wszystko się wiąże z indeksami nawet jeśli lecimy po PK... :/ Ale cóż tak już jest. My ogólnie wybraliśmy MyISAM jednak z pewnymi usprawnieniami i założeniami (IMG:style_emoticons/default/smile.gif)

nospor Zobacz profil	15.02.2012, 12:41:55 Post #14
Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004	Faktycznie sprytne (IMG:style_emoticons/default/smile.gif) No ale czemu wolniejsze to raczej logiczne. Cytat zapis jest dużo wolniejszy itd... No to z oczywistych względów. Ale właśnie zastanawia mnie prosty odczyt. No teoretycznie nie powinno być różnicy a jednak jest. No nic, trza nam z tym żyć (IMG:style_emoticons/default/wink.gif)

« Następny starszy · MySQL · Następny nowszy »

Reply to this topic

Start new topic

2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Standardowy · Przełącz na: Linearny+ · Przełącz na: Drzewo

Śledź ten temat · Wyślij temat na e-mail · Wydrukuj ten temat · Subskrybuj to forum

Aktualny czas: 20.09.2025 - 16:11

Powered By IP.Board © 2025 IPS, Inc.
All changes by PHP.pl Administrators

Hosting zapewnia

NQ.pl hosting, trac, svn