Odkrycie wiedza
/ Knowledge Discovery >> Odkrycie wiedza >> pieniądze >> ekonomika >> charytatywna firmy >>

Jak Fundacji Shoah Works

który pozwala jej personel zrobić wszystko, od przechowywania, katalogowania i indeksowania archiwum do wykonywania badań dla klientów Największa Wywiady międzynarodowe

Fundacji Shoah przeprowadziła wywiady w następujących 56 krajach:.

Argentyna, Australia, Austria, Białoruś, Belgia, Boliwia, Bośnia i Hercegowina, Brazylia, Bułgaria, Kanada, Chile, Kolumbia, Kostaryka, Chorwacja, Czechy, Dania, Ekwador, Estonia, Finlandia, Francja, Gruzja , Niemcy, Grecja, Węgry, Irlandia, Izrael, Włochy, Japonia, Kazachstan, Łotwa, Litwa, Macedonia, Meksyk, Mołdawia, Holandia, Nowa Zelandia, Norwegia, Peru, Polska, Portugalia, Rumunia, Rosja, Serbia i Czarnogóra, Słowacja, Słowenia, Republika Południowej Afryki, Hiszpania, Szwecja, Szwajcaria, Ukraina, Wielka Brytania, Stany Zjednoczone, Urugwaj, Uzbekistan, Wenezuela i Zimbabwe Katalogowanie. Największa i indeksowania Największa

Aby skatalogować szczególne świadectwo, pracownik wchodzi krótka biograficzne informacje o rozbitka lub świadka. Następnie, świadectwo jest indeksowana za pomocą określonych słów kluczowych wybranych z Fundacji Shoah 30000-word, kontrolowanego słownictwa, anglojęzyczny tezaurus. Stworzył także w domu, tezaurus rozwinęła się w czasie, jak indeksujący oglądać rzeczywiste świadectwo. Ponieważ słowa kluczowe w rzeczywistości pochodzą z zeznań, tezaurus będzie się rozwijać jako bardziej świadectwem jest indeksowany. Terminy indeksu są głównie geograficznych nazwy miejscowości, takie jak nazwy miast, wsi i innych miejsc, ale robią to empirycznej treści, jak również, takie jak " poczucie czasu w obozach ". Największa

Ponieważ tezaurus jest w języku angielskim, wszystkie obecne indeksowanie odbywa się w języku angielskim. Zeznania złożone w innych językach jest obsługiwane przez dwujęzycznych indeksujących. Największa

Na początku każdego zeznania film został indeksowane w trzy- do pięciominutowych odcinków, ale okazało się, że większość czasu spędził w tych krokach indeksowania zginęło próbując zdecydować, gdzie segment zakończył, a drugi zaczął - coś jak 75 procent czasu indeksowania spędził taśmy nawijane i szybkiego przewijania do przodu. Teraz zeznania są w podziale na segmenty jednominutowych. Największa

Każdy film ma uruchomiony kod czasu, więc każdy segment minutę jest reprezentowana przez określonego kodu czasu. Bibliotekarz przywiązuje jego warunki indeksu do tego kodu czasowego. W oparciu o to, co wymienione w jeden segment minut więcej niż jeden termin