Forum PHP.pl > [PHP] Usuwanie zduplikowanych wierszy z tablicy

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [PHP] Usuwanie zduplikowanych wierszy z tablicy

Mesajah

4.03.2011, 18:42:44

Witam,

Mam taki kodzik:

[PHP] pobierz, plaintext 
 $query = $_GET['query']." ".$_GET['field_name']." LIKE '".mysql_real_escape_string($input)."%'";
 
		if($limit > 0) $query .= " LIMIT $limit";
 
		$result = mysql_query($query, $link);		
 
		while($row = mysql_fetch_array($result, MYSQL_ASSOC)) { 
                $row2=$row[$_GET['field_name']];
		$row2 = str_replace('-', '',  $row2);
		$aResults[] = array( "id"=>0,"value"=>strtolower($row2));
		}
[PHP] pobierz, plaintext

W $aResults[] (po translacji strlower) pojawiają mi się zdublowane rekordy.
Chciałbym pozbyć się wszystkich powtórzeń i zostawić tylko unikalne elementy.
Jak to zrobić najlepiej ?

BTW A czy można w zapytaniu użyć distincta który jest case insensitive ?

Noidea

4.03.2011, 19:45:32

Sprawdź jaki masz metodę porównywania tekstu ustawioną dla tej kolumny. Jeśli kończy się na "_ci" (np. utf8_general_ci), to jest case insensitive. Jeśli kończy się na "_cs" albo "_bin" (np. latin1_general_cs, utf8_bin) to jest case sensitive.

Metodę porównywania napisów kolumny możesz zmienić przez ALTER TABLE, albo zdefiniować bezpośrednio w zapytaniu:

[SQL] pobierz, plaintext 
SELECT DISTINCT tekst COLLATE utf8_general_ci FROM tabela WHERE tekst LIKE "%aaa%"
[SQL] pobierz, plaintext

Ale pamiętaj, że DISTINCT odnosi się do całego wiersza, więc jeśli przy okazji pobierasz jakieś ID, czy inne kolumny, to może nie działać jakbyś się tego spodziewał.

PS. Zabezpieczenie w postaci mysql_real_escape_string( $input ), podczas gdy większa część zapytania pochodzi bezpośrednio z $_GET wygląda tak:
http://3.bp.blogspot.com/_6B8tPuW7TwQ/TQim...0/peclogate.jpg

Valdi_B

4.03.2011, 21:37:03

Po odczycie z bazy danych usuwasz z treści minusy i (jak sądzę) dopiero wtedy powstają powtórzenia.
Dlatego słowo DISTINCT w SQL'u to nie to czego trzeba.

Usuwać powtórzenia trzeba dopiero gdy one powstaną, czyli po modyfikacji wczytanych danych.
Załatwia to funkcja array_unique().

Mesajah

5.03.2011, 07:39:32

Próbowałem z tym array_unique() ale coś mi nie idzie.
W którym miejscu to wstawić ?

Zrobiłem tak:

[PHP] pobierz, plaintext 
while($row = mysql_fetch_array($result, MYSQL_ASSOC)) { 
$row2=$row[$_GET['field_name']];
$row2 = str_replace('-', '',  $row2);
$aResults[] = array( "id"=>0,"value"=>strtolower($row2));
$aResults[] = array_unique($aResults[]);
		}
[PHP] pobierz, plaintext

Ale nie działa ...

Gdy zamienię ostatnią linijkę na:

[PHP] pobierz, plaintext 
$aResults[] = array_unique($aResults); to jest niby lepiej (skrypt jakoś dziala)
[PHP] pobierz, plaintext

ale dalej mam powtórzenia.

Jak to poprawić ?

Valdi_B

5.03.2011, 09:19:26

Kolejność jest taka:
1. Najpierw w pętli gromadzisz dane w tablicy (usuwając minusy).
2. Dopiero po pętli robisz:
$aResults = array_unique($aResults);

Mesajah

5.03.2011, 10:30:59

Zrobiłem tak jak mówisz i po pętli dałem array_unique:

[PHP] pobierz, plaintext 
	while($row = mysql_fetch_array($result, MYSQL_ASSOC)) { 
        $row2=$row[$_GET['field_name']];
		$row2 = str_replace('-', '',  $row2);
		$aResults[] = array( "id"=>0,"value"=>strtolower($row2));
		//$aResults[] = array_unique($aResults);
		}
		$aResults = array_unique($aResults);
[PHP] pobierz, plaintext

jednak wciąż nie działa :/

Valdi_B

5.03.2011, 11:02:42

Przeoczyłem, że elementami $aResults nie są "zwykłe" stringi, ale tablice.

Proponuję taką kolejność:
1. W pętli dodawaj do innej tablicy (np. $rob) same stringi:

[PHP] pobierz, plaintext 
$rob[] = strtolower($row2);
[PHP] pobierz, plaintext

2. Po pętli usuń powtórzenia:

[PHP] pobierz, plaintext 
$rob = array_unique($rob);
[PHP] pobierz, plaintext

3. Dopiero wtedy pobieraj z $rob kolejne stringi i zmontuj tablicę - wynik:

[PHP] pobierz, plaintext 
foreach ($rob as $tt) {
  $aResults[] = array( "id"=>0,"value"=>$tt);
}
[PHP] pobierz, plaintext

Mesajah

7.03.2011, 08:35:47

Zrobiłem tak jak mówiłeś:

[PHP] pobierz, plaintext 
	while($row = mysql_fetch_array($result, MYSQL_ASSOC)) { 
		$row2=$row[$_GET['field_name']];
		$row2 = str_replace('-', '',  $row2);
	    $rob[] = strtolower($row2);
		}
 
        $rob = array_unique($rob);
	    foreach ($rob as $tt) {
        $aResults[] = array( "id"=>0,"value"=>$tt);
        }
[PHP] pobierz, plaintext

Jednak wciąż mam powtórzenia (dokłdnie takie jak wcześńiej).
Czy coś robię nie tam ?

Valdi_B

7.03.2011, 12:11:13

Jestem zaskoczony. Sprawdziłem Twój kod na swoich przykładowych danych i (w mnie) powtórzenia się eliminują.
Podejrzenie: A może gdzieś na początku pola masz spację?
(końcowe spacje nie powinny mieć znaczenia, bo baza danych je "obcina").

Dla sprawdzenia zmień pętlę na:

[PHP] pobierz, plaintext 
foreach ($rob as $tt) {
  $aResults[] = array( "id"=>0, "value"=>$tt, "dlug"=>strlen($tt));
}
print_r($aResults);
[PHP] pobierz, plaintext

i dla powtarzających się tekstów porównaj "dlug".

Edit:
Zrobiłem jeszcze eksperyment ze wstawieniem do tekstów polskich liter i widzę, że:
1. Domyślnym kodowaniem po mysql_connect(...) jest latin1, natomiast ja mam i bazę i stronę w UTF-8.
Po otwarciu b.d. należy dać: mysql_set_charset('utf8');
2. Przekodowanie na małe litery trzeba robić przez mb_strtolower($row2, 'UTF-8');
Zwykła funkcja strtolower(...) wstawia za polskie znaki "?".

Może już sam do tego doszedłeś, ale na wszelki wypadek - wspominam o tym.

Mesajah

7.03.2011, 20:36:17

1. Pomijam kwestie ogonków bo to już inna sprawa (baze mam w utf, ale akurat tą tabele w latin2 a strona znowu utf;)), ale
nawet przy typowo angielskich nazwach są powtórzenia.

2. Nie mogę wyświetlić danych za pomocą print_r, gdyż skrypt działa jakby ajaxowa podpowiedź na stronie,
i gdy go wywołuje z parametrem to dostaje 1000 błędów, a bezpośrednio nie widzę co zwraca print_r.

3. Może wpływ na wszystko ma dalsza część kodu, której nie podałem:

[PHP] pobierz, plaintext 
	$link = mysql_connect($host, $user, $pass);
	mysql_select_db($name, $link);
 
	if ($len)
	{
		//$query = $_GET['query']." MATCH(".$_GET['field_name'].") AGAINST ('".mysql_real_escape_string($input)."*' IN BOOLEAN MODE)";
		//if(!empty($_GET['orderby'])) $query .= " ORDER BY ".$_GET['orderby'];
        $query = $_GET['query']." ".$_GET['field_name']." LIKE '".mysql_real_escape_string($input)."%'";
 
		if($limit > 0) $query .= " LIMIT $limit";
 
		$result = mysql_query($query, $link);		
 
		while($row = mysql_fetch_array($result, MYSQL_ASSOC)) { 
		$row2=$row[$_GET['field_name']];
		$row2 = str_replace('-', '',  $row2);
	    $rob[] = strtolower($row2);
		}
 
        $rob = array_unique($rob);
	    foreach ($rob as $tt) {
        $aResults[] = array( "id"=>0,"value"=>$tt);
        }
 
	  }
 
	header ("Expires: Mon, 26 Jul 1997 05:00:00 GMT"); // Date in the past
	header ("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT"); // always modified
	header ("Cache-Control: no-cache, must-revalidate"); // HTTP/1.1
	header ("Pragma: no-cache"); // HTTP/1.0
	header("Content-Type: application/json");
 
	echo "{\"results\": [";
	$arr = array();
	for ($i=0;$i<count($aResults);$i++) {
		$arr[] = "{\"id\": \"".$aResults[$i]['id']."\", \"value\": \"".$aResults[$i]['value']."\", \"info\": \"\"}";
	}
	echo implode(", ", $arr);
	echo "]}";
[PHP] pobierz, plaintext

Czy ta dalsza część może coś zmieniać ?

BTW

Cytat

Zabezpieczenie w postaci mysql_real_escape_string( $input ), podczas gdy większa część zapytania pochodzi bezpośrednio z $_GET wygląda tak:
http://3.bp.blogspot.com/_6B8tPuW7TwQ/TQim...0/peclogate.jpg

Dobre ;]

Valdi_B

7.03.2011, 21:50:47

Rada1: Jak sprawdzić, czy w polu "x" są pocz. spacje:

SELECT * FROM <tabela>
WHERE substr(x, 1, 1) = " "

Uruchom taką kwerendę (np. spod phpMyAdmin'a).

Rada 2:
Zmień $row2=$row[$_GET['field_name']];
na $row2 = 'x' . $row[$_GET['field_name']];
Wtedy ew. pocz. spacja w treści będzie widoczna.
Alternatywa:
zamień na $row2=trim($row[$_GET['field_name']]);
to obetniesz ew. pocz. spacje.

Rada 3: Zamiast "zwykłego" print_r($rob); zrób $xx = print_r($rob, true);
Zmienną $xx zapisz do jakiegoś pliku.
Potem podejrzyj ten plik.

Rada 4: Zrób z tego fragmentu kodu oddzielny plik i uruchom jako "normalną" stronę (a nie spod Ajax'a).
Wtedy będziesz mógł wstawić dowolne print_r.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.