Acesse o Portal do Governo Brasileiro   
 
 
 
DCC
 
   
TÍTULO DA SEÇÃO
Página Inicial
Mestrado
Doutorado
Especialização

Mestrado em Ciência da Computação


Retornar

NÚmero:
782
Aluno:
Fabiano Muniz Belém
Orientador:
Jussara Marques de Almeida Gonçalves
LINHA DE PESQUISA:
Sistemas Distribuídos
TÍtulo da defesa:
Recomendação associativa de tags considerando múltiplos atributos textuais
NÚmero de pÁginas:
79
Data da defesa:
06/07/2011
Local:
Sala 2029 do ICEx
HorÁrio:
10:30
Banca Examinadora:
Profa. Jussara Marques de Almeida - Orientadora (Dra. (Departamento de Ciência da Computação - UFMG))
Prof. Marcos André Gonçalves - Co-orientador (Dr. (Departamento de Ciência da Computação - UFMG))
Prof. Pável Pereira Calado (Dr. (Universidade Técnica de Lisboa))
Prof. Altigran Soares da Silva (Dr. (Departamento de Ciência da Computação - UFAM))
Prof. Nivio Ziviani (Dr. (Departamento de Ciência da Computação - UFMG))
Resumo:
Diversas aplicações da Web 2.0 permitem aos usuários a livre atribuição de palavras-chave (tags) ao conteúdo, para prover uma melhor organização e descrição do mesmo. Nessas aplicações, serviços de recomendação de tags podem auxiliar o usuário nesta tarefa, melhorando a qualidade da informação disponível e, consequentemente, a eficácia de serviços de Recuperação de Informação (RI) que exploram tags, tais como busca e classificação. Esta dissertação aborda duas tarefas relacionadas à recomendação de tags. A primeira tem foco no objeto, objetivando sugerir tags que sejam relevantes a um determinado conteúdo. A segunda tarefa é personalizada, visando recomendar tags que sejam relevantes ao mesmo tempo a um objeto alvo e a um usuário alvo. Nossas estratégias de recomendação focadas no objeto exploram conjuntamente três dimensões do problema: (i) co-ocorrência de termos com tags previamente associadas ao objeto alvo; (ii) termos extraídos de múltiplos atributos textuais; e (iii) várias métricas de relevância de tags. Nossas estratégias de recomendação de tags personalizada exploram todas as dimensões mencionadas acima e o histórico de atribuições de tags do usuário alvo. Em particular, nós propusemos várias novas heurísticas, que estendem estratégias estado-da-arte, incluindo novas métricas que tentam capturar a capacidade de um termo descrever o conteúdo de um objeto. Nós também exploramos duas técnicas baseadas em learning-to-rank (L2R), a saber, RankSVM e Programação Genética (PG). Elas geram funções que combinam múltiplas métricas para estimar a relevância de uma tag a um dado objeto ou a um par objeto-usuário. Nós avaliamos os métodos propostos em vários cenários, em três aplicações populares da Web 2.0: LastFM, YouTube e YahooVideo. Os resultados de nossas heurísticas apresentam ganhos significativos em precisão e revocação quando comparados às melhores estratégias utilizadas como linhas de base. Alguns ganhos adicionais modestos podem também ser obtidos através de nossas estratégias baseadas em L2R. Apesar dos ganhos serem modestos, vale ressaltar que essas técnicas têm a vantagem de serem bem flexíveis, podendo ser facilmente estendidas para explorar outros aspectos do problema de recomendação de tags.
ABSTRACT:
Several Web 2.0 applications allow users to assign keywords (tags) to the content, in order to provide a better organization and description of the shared content. Tag recommendation tasks may assist users in this task, improving the quality of the available information and, thus, the effectiveness of Information Retrieval (IR) services which exploit tags, such as searching and classification. This work addresses two tag recommendation tasks. The first one aims at suggesting relevant tags to a target object. The second task is personalized, aiming at recommending tags which are simultaneously relevant to a target object and a target user.Our tag recommendation strategies focused on the object jointly exploit three dimensions of the problem: (i) term co-occurrence with tags pre-assigned to the target object, (ii) terms extracted from multiple textual features, and (iii) several metrics of tag relevance.Our personalized tag recommendation strategies exploit all dimensions mentioned above and a metric related to the history of tag assignments of the target user. In particular, we propose several new heuristic methods, which extend previous, highly effective and efficient, state-of-the-art strategies by including new metrics that try to capture how accurately a candidate term describes the objects content. We also exploit two learning to rank techniques, namely RankSVM and Genetic Programming, for the task of generating ranking functions that combine multiple metrics to accurately estimate the relevance of a tag toa given object or pair user-object. We evaluate all proposed methods in various scenarios for three popular Web 2.0 applications, namely, LastFM, YouTube and YahooVideo. We found that our heuristics greatly outperform the best baseline in each scenario and task. Some further, modest improvements can also be achieved, in some scenarios of both personalized and object-focused, with our new learning-to-rank based strategies. However, they have the additional advantage of being quite flexible and easily extensible to exploit other aspects of the tag recommendation problem.
Palavras-chave:
Métricas de Relevância, Recomendação de Tags, Web 2.0
DissertaÇÃO no formato PDF:
 
 
 
DCC
Av. Antônio Carlos 6627 - Pampulha
Prédio do ICEx - Anexo U - sala 5309
Belo Horizonte - Minas Gerais - Brasil
CEP: 31270-010
Telefone: (31) 3409-5860 Fax: (31) 3409-5858