Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Baza danych google. Jak to możliwe?
Zwariowany
post 30.06.2009, 23:57:51
Post #1





Grupa: Zarejestrowani
Postów: 201
Pomógł: 0
Dołączył: 6.01.2009

Ostrzeżenie: (20%)
X----


Jak myślicie jakiej bazy danych używa google, i jakim cudem tak szybko pojawiają nam się wyniki wyszukiwań?


--------------------
Go to the top of the page
+Quote Post
sowiq
post 1.07.2009, 08:50:53
Post #2





Grupa: Zarejestrowani
Postów: 1 890
Pomógł: 339
Dołączył: 14.12.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Pół minuty wyszukiwania w Google i proszę:

Webhosting.pl:
Cytat
Wygląda na to, że Google przygotowuje się do udostępnienia BigTable'a – swojego wewnętrznego systemu bazodanowego – jako usługi sieciowej. W ten sposób baza danych, na której bazuje największa wyszukiwarka na świecie, stanie się bezpośrednią konkurencją dla coraz popularniejszej usługi Amazona – SimpleDB.

BigTable

Pamiętaj tylko, że do tego rodzaju działalności (jak wyszukiwarka Google) nie wystarczy 'baza danych'. To są systemy rozproszone na kilkadzeisiąt/set/tysięcy? maszyn. Nikt raczej nie potrzebuje takich rozwiązań, więc G pisze je sobie samo na własny użytek.
Przynajmniej tak to sobie tłumaczę. A jak jest na prawdę wiedzą pewnie tylko pracownicy.

Ten post edytował sowiq 1.07.2009, 08:52:00
Go to the top of the page
+Quote Post
Zwariowany
post 1.07.2009, 08:57:17
Post #3





Grupa: Zarejestrowani
Postów: 201
Pomógł: 0
Dołączył: 6.01.2009

Ostrzeżenie: (20%)
X----


a jak to możliwe, że wpisuje słowo i wynik od razu mam? przecież to do przeszukania czasem miliardy stron ...


--------------------
Go to the top of the page
+Quote Post
osl
post 1.07.2009, 09:01:07
Post #4





Grupa: Zarejestrowani
Postów: 260
Pomógł: 41
Dołączył: 6.04.2009
Skąd: Gdańsk/okolice

Ostrzeżenie: (0%)
-----


nie zagłębiałem się w temat, ale podejrzewałbym rodzaj cache... przechowywany zapewne w pamięci.
I do tego pamiętaj, że Google posiada niewyobrażalną ilość maszyn do obsługi tego, to nie jest byle serwer winksmiley.jpg
Go to the top of the page
+Quote Post
erix
post 1.07.2009, 14:29:33
Post #5





Grupa: Moderatorzy
Postów: 15 467
Pomógł: 1451
Dołączył: 25.04.2005
Skąd: Szczebrzeszyn/Rzeszów




Tak, cache w RAM-ie. Te maszyny nie są prawie wcale resetowane.


--------------------

ZCE :: Pisząc PW załączaj LINK DO TEMATU i TYLKO w sprawach moderacji :: jakiś błąd - a TREŚĆ BŁĘDU? :: nie ponaglaj z odpowiedzią via PW!
Go to the top of the page
+Quote Post
Darti
post 4.07.2009, 20:29:35
Post #6





Grupa: Zarejestrowani
Postów: 1 076
Pomógł: 62
Dołączył: 6.03.2005
Skąd: Wroc

Ostrzeżenie: (0%)
-----


zauważ ze nie dostajesz od razu wszystkich wyników tylko te najszybciej wyszukane (pierwsze z brzegu). To jak wejść do archiwum o rozmiarach boiska pełnego teczek z danymi w celu dostania dwóch - bierzesz te, które są z brzegu i otwierasz a w tle baza się porządkuje i przestawia podobne teczki tych. ktore wziąłeś bliżej wejścia (jak nastepni wejdą to znajdą już bardziej przybliżone dane).


--------------------
The answer is out there, Neo. It's looking for you. And it will find you, if you want it to.
SERVER_SOFTWARE : Apache/2.2.4 (Win32) PHP/5.2.1
MySQL Client API version : 5.0.27
Go to the top of the page
+Quote Post
www.aukcje.fm
post 20.10.2012, 20:28:16
Post #7





Grupa: Zarejestrowani
Postów: 173
Pomógł: 1
Dołączył: 4.05.2010

Ostrzeżenie: (20%)
X----


Erix jak w ramie można trzymać tyle stron? Imdexujemy od niedawna polski net i to są ogromne ilości danych, taki backup stron internetowych, nie można tego trzymać w ramie.

hehe jak zaczniecie szukać słów których nie ma zobaczycie że google to jeden wielki słownik. Będzie wam na siłę wmuszał szukanie swoich słów z mega słownika słów które ma ustalone. Zapomnijcie o szukaniu w google w trybie online. Tam dosłownie nie ma takiego czegoś jak szukanie online. Tam każde słowo jest dobrane do słownika, dla niego są algorytmy błędnej pisowni, synonimy, odmiana na osoby,. przypadki, liczby. Każde słowo pewnie ma swój numer i szuka w siatce dla konstrukcji ala tree lub indexuje wszystko binarnie i tak naprawdę ma swoją rzeczywistość i nawet nie wie czego szukamy bo ma swoje odwzorowanie dla szukania tak wyrąbane w kosmos, ale oparte o słownik, słownik to podstawa. A i nie da rady aby wyniki były chociaż w 1 % inne miejscami, chyba że cron google przejdzie po frazach i od nowa ustawi całość, jedne domeny nagle spadają drugie pną się do góry. Cronują maksymalnie i mają filtr ludzki dla top 10 - 30 dla popularnych słów (dostałem info z pewnego źródła dla naszej domeny) a już napweno na ścisłe top dla ultra popularnych fraz któe nie mogą się zmieniać. Nie może być np na pierwszym miejscu dla frazy allegro inny serwis niż allegro bo został ładnie wypozyjonowany, nie chodzi o allegro ale o większość fraz wysoce szukanych które mają swoją moderację ręczną, bo nie może bot wyliczyć że mogło by być inaczej. Dochodzi również klikalność w linki, jako pewnego rodzaju ukryty sondaż, ta domena lepsza dla tej frazy bo więcej osób na nią klika. Dla mieszanki słów jako frazy mają znaczenie wyniki dla pojedynczych słów, jako mnożnik w całości algorytmu, uzależniony od natężenia SEO. Wiele do opowiadania ale już starczy bo google się obrazi i znów napisze list do nas z uwagami.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 25.06.2025 - 05:33