2013 TREC Microblog 评测总结

一.评测内容简介

TREC是每年一度由美国国家标准技术研究院举办的文本检索会议国际公开评测,旨在通过以大规模数据为基础的信息检索关键技术评测来促进信息检索研究的发展。目前已成为信息检索领域最有影响的技术评测,反映了该领域最前沿的研究和最新的技术突破。

Microblog Track微博检索评测今年只有一个任务——实时ad hoc检索任务(real-time ad hoc search)。它是用户输入特定时间的查询,从twitter语料集中检索出按相关度排序的微博列表并对每条微博进行打分。对于相对稳定的数据库,根据特定时间的topic进行查询扩展,结果返回按时间倒排的相关度高、信息量大的前1000条 tweets。

二.参加人员和参加机构介绍

我们实验室的主要参加人员

指导老师:陈光老师,徐雅静老师

参与人员:朱思明,高哲,王辉,袁亚静

主要参加机构

本次TREC Microblog Track吸引了20所国内外高校机构参赛,共提交71次结果。具体高校为:

–    Albalqa’ Applied University

–    The University of Michigan

–    Indian Statistical Institute, Kolkata, India

–    Institt de Recherche en Informatique de Toulouse

–    Kobe University

–    Universidade Nova de Lisboa

–    Qatar Computing Research Institute

–    Qatar University

–    InfoLab at University of Delaware

–    The University of Glasgow

–    University of Amsterdam

–    Web Information Systems group, TU Delft

–    北京大学

–    中科院计算所

–    武汉大学

–    北京交通大学

–    北京邮电大学

三.评测相关链接

评测主页https://github.com/lintool/twitter-tools/wiki/TREC-2013-Track-Guidelines

评测论坛: http://groups.google.com/group/trec-microblog

四.PRIS团队参赛情况

评测思路

针对本次TREC Microblog 评测任务的具体要求,我们的工作主要从以下两方面展开:1,对微博的查询主题进行查询扩展。2,对查询返回的微博进行相关度重排序。其中,查询扩展部分我们主要使用了WAF和基于TF-IDF相关反馈两种方法。相关度重排序部分我们采用了结合多feature的线性加权算法,综合考虑主题词,扩展词及微博内URL对微博相关性进行排序

【评测结果】

QQ截图20131226135531

评测结果在automatic结果队伍中排名第一,所有队伍中排名第二

【参加人员:朱思明,高哲,王辉,袁亚静】

朱思明朱思明gz高 哲

QQ截图20140104161218王 辉 袁亚静袁亚静

发表评论

电子邮件地址不会被公开。 必填项已用*标注