Odkrycie wiedza
/ Knowledge Discovery >> Odkrycie wiedza >> tech >> komputer >> Internet >> podstawy Internetu >>

Jak internetowe Wyszukiwarki Work

cia zwykle czynił pająk działać szybciej, pozwalają użytkownikom na bardziej efektywne wyszukiwanie, lub obu. Na przykład, niektóre pająki będzie śledzić słów w tytule, pod-działów i linków, wraz z 100 najczęściej używanych słów na stronie i każdego słowa w pierwszych 20 linii tekstu. Lycos mówi się użyć tego podejścia do spidering Web Największa

Inne systemy, takie jak AltaVista, iść w innym kierunku, indeksowanie każde słowo na stronie, w tym ". A, " " an, " " " i inne " nieistotne " słowa. Nacisk do kompletności w tym podejściu jest dopasowany przez inne systemy w zwróceniem uwagi na niewidocznej części strony internetowej, meta tagi. Dowiedz się więcej o meta tagi na następnej stronie. Największa meta tagi

Meta tagi pozwalają właściciel strony, aby określić słowa kluczowe i pojęć, pod którą stronę będą indeksowane. Może to być przydatne, zwłaszcza w przypadkach, w których słowa na stronie może mieć podwójne lub potrójne znaczenie - meta tagi poprowadzi wyszukiwarkę w wyborze, który z kilku możliwych znaczeń tych słów jest prawidłowa. Istnieje jednak niebezpieczeństwo, w nadmierne poleganie na meta tagi, bo nieostrożny lub bez skrupułów właściciel strony może dodać meta tagi, które pasują bardzo popularne tematy, ale nie mają nic wspólnego z rzeczywistą zawartością strony. Aby uchronić się przed tym, pająki meta tagi koreluje z zawartością strony, odrzucając meta tagi, które nie pasują słowa na stronie. Największa

Wszystko to zakłada, że ​​właściciel strony rzeczywiście chce go mieć zawarte w wynikach działalności wyszukiwania wyszukiwarki. Wiele razy, właściciel strony nie chce, to pokazuje się na głównych wyszukiwarek, lub nie chce aktywność pająk dostęp do strony. Weźmy na przykład gry, która buduje nowe, aktywne strony każdy odcinki czasowe strony są wyświetlane lub nowe linki są przestrzegane. Jeśli Spider Web dostęp jedną z tych stron, a zaczyna po wszystkich linków do nowych stron, gra może pomylić aktywność na szybki ludzkiego gracza i wymknąć się spod kontroli. Aby uniknąć takich sytuacji, został opracowany protokół wykluczania robotów. Protokół ten, realizowany w sekcji meta-tag na początku strony sieci Web, mówi pająk opuścić stronę sam. - Ani do indeksu słów na stronie, ani próbować podążać jego związku Największa budowania indeksu

Gdy pająki ukończyli zadanie znalezienia informacji na stronach internetowych (i powinniśmy pamiętać, że jest to zadanie, które nie jest wł

Page [1] [2] [3] [4] [5] [6]