博鱼app官网知乎结合清华盛开海内最大本性化保举现实交互数据集
具体介绍

  5月21日,知乎结合清华大学对外绽放鉴于知乎的大范围富文本查问和保举数据集“ZhihuRec”。该数据集包罗了知乎上的1亿个行动数据,是今朝为止,海内用于本性化保举的最大的现实交互数据集。

  动作一个庞大数据集,ZhihuRec拥有交际化问答场景中的具体新闻,笼盖了知乎10天内、79.8万用户、16.5万个题目、55.4万个回覆、24万个作家、7万线万用户搜刮行动日记,保存了完备的用户交互(譬喻点击、跳过、搜刮等)、机会和体例新闻,且所稀有据均颠末脱敏处置。

  该数据集可用于评价通例crowning-N保举、挨次保举和左右文感知保举中的算法利用,还可用于集成搜刮和保举和带有负反应的保举。 另外,该数据集不但能够用于保举研讨,还能够利用于用户建模(譬喻,性别展望,用户乐趣展望),搜刮和保举体系的拉拢和其余风趣的主旨。

  本性化保举手艺已普遍利用于购物、视频、浏览、交际等互联网场景。但绽放式大范围确凿场景数据集极度罕见博鱼app官网。ZhihuRec数据集的绽放,不但富厚了绽放式大范围确凿场景数据集的研讨模范,更弥补了保举体系顶用户交互日记的空缺。

  知乎建立十年来,堆积了跨越3 .53亿条体例,天天会增加跨越2000万条创建和互动,为华文互联网孝敬了贵重的文本资产。

  2018年,知乎曾结合华夏新闻检索学术集会(CCIR)、清华大学计较机系新闻检索问题组(THUIR)配合举行了“迁徙情况下常识瓜分平台上的体例保举”大赛,初次在角逐中绽放ZhihuRec数据集,吸收了浩繁高校和企业手艺团队参赛和存眷。这次知乎结合清华大学将该数据集进一步富厚并周全绽放,旨在经过更大规模的数据开源,为行业算法手艺冲破与演进供给更多半据和场景撑持。

 

Copyright 2012-2023 博鱼app官方 版权所有 HTML地图 XML地图 非商用版本丨网站备案号:闽ICP备20000759号