返回列表

作者:巨人电商

抖音是怎么给用户推荐视频的,机器如何准确理解短视频内容?

POST TIME:2021-08-20

用户志愿者免费审核,像内涵段子那样。标签很多,难度大,专职打标签的姑娘们还经常犯错,志愿者不能胜任。 那标签怎么打才好呢?

发布者自打标签 相对于拍摄、剪辑视频,打标签的工作量微不足道。生产用户对视频的理解最深刻,标签打算最准,也有动力去打准。 自打标签能同时达成几个目标,标签准确、成本低廉、垂类聚焦、及时发现新标签、识别搬运视频。 这里给出一个粗略的方案,用于说明思路。 在视频发布之前,生产用户可以选填下列7类标签和字幕。 一级标签5个:最粗的类别,例如搞笑、体育、美女。

二级标签5个:较粗的类别,例如夫妻搞笑、动物搞笑、相声、小品。 三级标签5个:最细的类别,例如西欧女友搞笑、俄罗斯女友搞笑、东北年轻夫妻搞笑。 四级标签0~5个:只含实体,不包含概念。例如对一个电视剧剪辑视频,实体标签可以为:电视剧《铁齿铜牙纪晓岚》、和坤、纪晓岚。 地点标签0~5个:如果有地域特色那么标记地点。例如视频内容是颐和园景色,那么地点标签可设为颐和园;如果视频内容是美女跳舞,只是实际拍摄地点为颐和园,那么不用设地点标签。 主题标签5个。自定义,长度不超过50个字,用于概括整个视频,尽量能用它唯一地搜索到这个视频,例如“纪晓岚让弘历记住沙河深(杀和坤)”。 话题标签:自定义,例如“女孩跑步上班引围观”,目的是按此话题能搜索到一批视频。 字幕脚本:视频中字幕的文字稿。 一二三级标签由推荐系统定义,四级标签可以选用推荐系统定义的标签,也可以自定义新的标签。7类标签和字幕对消费用户不可见,只对发布者和推荐系统可见。 一至四级标签能让推荐系统按喜欢程度选择消费用户,四级标签相同的消费用户最喜欢,一级标签相同的消费用户可能一般喜欢,设定反馈指标阈值时需要考虑喜欢程度。自定义标签用来帮助推荐系统发现新标签,字幕可以用来检查是否违规、自打的标签是否合理。如果一个视频没有自打标签,特别是没有字幕脚本,那么它很可能是搬运过来的,或者质量较低(不值得生产用户花费微小的精力)。

自打标签作弊怎么办? 如果推荐系统不加审核地按照自打标签进行推荐,那么生产用户就可能为了流量而作弊。例如为冷门视频打上热门话题标签、为广告打上非广告标签。 解决办法是一套组合拳。 门槛、审核与处罚。生产用户要达到一定级别之后才能获得自打标签权限;用算法打标签,然后与自设标签对比,将可能作弊的标签提交人工审核;对作弊严重的生产用户进行限流、封号。这些是常规操作,不赘述。

还想了解更多关于抖音短视频的朋友可以添加我的微信:2777452455,我会把我这几年做抖音的经验分享给你。

限定垂类。生产用户要提前选定自己的5~2个垂类,例如搞笑,一旦选定,一段时间内不能更改。视频的一级标签只能在这5~2个垂类中选择,二三四级标签只能在一级标签的下级标签中选择。这个规定能够用代码自动执行。 消费用户检验。将视频试投给兴趣标签一致的消费用户,用播放、互动数据找出作弊标签。例如,视频有标签“德云社相声”, 挑选一批消费用户,他们的兴趣标签里有“德云社相声”。如果完播率、转评赞数据明显偏低或偏高,那么该标签可能作弊,转交人工审核。迭代调整阈值,在人工审核数量和发现几率之间找到一个平衡点。 信用分。如果视频的标签准确、消费用户反馈数据良好,那么给生产用户加分。反之减分。如果生产用户的信用分高,那么多给流量,反之少给流量。 经过这几步操作,生产用户为持续获得流量,会诚实地设置标签,消费用户的兴趣标签也越来越准确,人工审核成本持续下降。投机取巧的生产用户,会被逐渐标记出来,流量越来越少,直至改邪归正或者离场。

深度学习理解视频的能力还很弱,适当设计产品规则,也许能达到准备理解的目标。

标签:锡林郭勒盟 云浮 南充 肇庆 南昌 中山 三亚 新乡