数据集
名称 | 格式 | 链接 | 提取码 |
---|---|---|---|
2015 entity linking in search query(public)
|
数据描述
该任务来自NLPCC 2015评测任务,该任务的目标是对短queries中的实体进行识别并链接到对应的中文知识库中。本数据集包括一个中文知识库,该知识库来自各类中文百科的信息框,包括中文维基百科和百度百科。该数据集还包括每个实体页面的第一段作为该实体的摘要。这个知识库不可避免地含有部分噪音数据,但是相对容易访问,并且确实为每个实体提供了一个相对结构化的描述信息。有关该任务和数据集详细描述请见NLPCC 2015 Shared Task:http://tcci.ccf.org.cn/conference/2015/pages/page05_evadata.html
数据提供
提供方:北京大学冯岩松副教授
主页地址:https://sites.google.com/site/ysfeng/home
联系方式:fengyansong(at)pku.edu.cn
相关论文:Feng Y., Han Z., Zhang K. (2015) Overview of the NLPCC 2015 Shared Task: Entity Recognition and Linking in Search Queries. In: Li J., Ji H., Zhao D., Feng Y. (eds) Natural Language Processing and Chinese Computing. Lecture Notes in Computer Science, vol 9362. Springer, Cham