Catalogação e indexação


Foto cedida Fundação Shoah
Uma funcionária da Fundação Shoah acompanha uma pesquisadora a buscar uma informação no banco de dados
Para catalogar um depoimento específico, um funcionário digita uma informação biográfica curta sobre o sobrevivente ou a testemunha. O depoimento então é indexado com palavras-chave específicas selecionadas pelo dicionário de sinônimos de 30 mil palavras da Fundação Shoah. Também criado pela instituição, o dicionário vai ampliando à medida que os indexadores assistem ao depoimento corrente. Como as palavras-chave são originadas a partir do depoimento, o dicionário continua sendo expandido à medida que mais depoimentos são indexados. Os termos indexados são principalmente geográficos, como nomes de cidades, vilarejos e outros locais, mas também incluem conteúdo experimental como "noção de tempo nos campos".

Uma vez que os verbetes estão em inglês, toda a indexação é feita em inglês, entretanto os depoimentos em outros idiomas são arquivados por indexadores bilíngües.

Primeiramente, cada depoimento em vídeo foi indexado em segmentos de três a cinco minutos, mas descobriram que era muita perda de tempo tentar decidir onde um segmento terminava e outro começava - algo como 75% de tempo de indexação era perdido retrocedendo e adiantando a fita. Agora os depoimentos estão fragmentados em segmentos de um minuto.

Cada vídeo tem um código de tempo em curso, então cada segmento de um minuto e representado por um código de tempo especial. O indexador anexa seu termo ao código de tempo, e baseado no que é registrado no segmento de um minuto, mais de um termo indexado pode ser associado com um segmento dado. O programa de catalogação é projetado para que o indexador apenas selecione e arraste os termos apropriados de um menu para outra janela e para que automaticamente faça um link de uma palavra-chave para o código de tempo.