Ponieważ sieć jest tak ogromny, monitorowanie i utrzymanie jest trudnym zadaniem. Podczas opracowywania GFS, programiści postanowili zautomatyzować tyle obowiązków administracyjnych wymaganych do utrzymania systemu, jak to możliwe. Jest to kluczowa zasada autonomicznego computing, koncepcji, w której komputery są w stanie zdiagnozować problemy i ich rozwiązania w czasie rzeczywistym bez konieczności interwencji człowieka. Wyzwaniem dla GFS zespołu było nie tylko stworzenie automatyczny system monitorowania, ale również zaprojektować go tak, by mógł pracować w całej ogromnej sieci komputerów. Największa
Kluczem do konstrukcji zespołu była koncepcja uproszczenia , Doszli do wniosku, że systemy rosną bardziej złożone problemy powstają częściej. Proste podejście jest łatwiejsze do kontroli, nawet gdy skala systemu jest ogromna. Największa
Na podstawie tej filozofii, zespół GFS zdecydował, że użytkownicy będą mieli dostęp do podstawowych komend plików. Są to komendy, takie jak otwarte, tworzyć, czytać, pisać i zamykanie plików. Zespół zawiera również kilka wyspecjalizowanych poleceń: append i migawki. Stworzyli wyspecjalizowanych poleceń w oparciu o potrzeby Google. Dołącz pozwala klientom dodać informacje do istniejącego pliku bez nadpisywania wcześniej zapisanych danych. Migawka jest polecenie, które powoduje szybką kopię zawartości komputera. Największa
Pliki na GFS wydają się być bardzo duże, zazwyczaj w wielu gigabajt (GB) zakresie. Uzyskiwanie dostępu i manipulacji plikami że duże nie zajmują dużej przepustowości sieci. Szerokość pasma jest zdolność systemu do przenoszenia danych z jednego miejsca do drugiego. GFS rozwiązuje ten problem poprzez złamanie pliki się na kawałki 64 megabajtów (MB) każda. Każdy fragment otrzymuje unikalny 64-bitowy numer identyfikacyjny zwany uchwyt kawałek. Podczas gdy GFS może przetwarzać mniejsze pliki, jej twórcy nie optymalizacji systemu dla tych rodzajów zadań. Największa
Według wymagające wszystkie fragmenty plików, aby mieć taki sam rozmiar, GFS upraszcza aplikację zasobów. To proste, aby zobaczyć, które komputery w systemie są w pobliżu zdolności, i które są w pełni wykorzystany. Jest to także łatwy w kawałki portów z jednego źródła do drugiego, aby zrównoważyć