YouTube油管是根据什么推荐视频的?视频推荐系统是如何运作的?不知道大家在做youtube流量优化的时候,有没有想过这类问题。所以今天跟大家分享一篇由油管工程师发表的文章,一起来看看油管是怎样把视频推荐给受众的。
本文作者:YouTube 工程研发副总裁 Cristos Goodrow
原文:https://blog.youtube/inside-youtube/on-youtubes-recommendation-system/
当 YouTube 推荐系统发挥理想成效时,能为全球数十亿使用者提供合适的内容,让他们透过独特的体验获得灵感、知识和娱乐。就我而言,这个系统可以协助我找到各种演讲和影片,以了解当今科技所涉及的伦理议题,或是重温小时候看过的南加大美式足球赛事的精彩片段。对我的大女儿而言,她可以从 Vlogbrothers 影片中找到欢乐及同好。至于我的大儿子,推荐系统让他能透过 3Blue1Brown 的动画教学影片充分理解线性代数,而休息时间则可以观看 KSI 的影片。
从我家人的使用体验来看,几乎每一部影片都有各自的受众群,而推荐系统的任务就是要找到这群受众。我们不妨想像一下,如果没有图书馆员的协助,要在一座庞大的图书馆中寻找一本书,会有多么困难。YouTube 大量的观看次数来自推荐系统,它的成效甚至超越频道订阅和搜索功能。我参与 YouTube 推荐系统的建构工作已有十多年的时间,对于这套系统如今已成为 YouTube 所有使用者体验中不可或缺的一部分,我感到十分骄傲。但是推荐系统的运作原理往往被视为神秘的黑箱作业。我们希望一般大众都能够了解这套系统,因此我要为大家说明这套系统的运作方式、演进历程,以及为何我们将提供理想的推荐内容视为优先要务。
什么是推荐系统?
我们在建构推荐系统时,秉持的原则就是协助使用者找到他们想观看且对他们而言具有价值的影片。
推荐系统主要在两个位置运作:使用者的首页和“即将播放”面板。首页是你开启 YouTube 时第一个看到的画面,其中会显示个性化推荐内容、订阅项目,以及最新动态和信息等。而在观看影片时,系统会根据你目前观看的影片,以及我们认为你可能感兴趣的内容,推荐建议内容在“即将播放”面板当中。
早在 2008 年,我们就开始著手建构推荐系统,但当时提供的体验和现在截然不同。举例而言,假设你最常观看烹饪类别的影片,但首页只因为最新推出的运动和音乐影片观看次数最高就向你推荐这些影片的话,是不是很令人失望?这就是 YouTube 早期的做法。系统会根据影片的受欢迎程度决定排名,建立一个庞大的“发烧影片”页面。观看过这些被推荐影片的使用者并不多,绝大多数 YouTube 观看次数都是由平台以外的搜索或他人分享的连结而来。
如今,我们的系统会从数十亿部影片中,完全根据你的兴趣量身打造出推荐内容。举例来说,因为我观看了一场 USC 美式足球经典赛事的精华片段,系统便帮我找出当年其他运动赛事的精华片段,而如果没有推荐系统,我绝对不会知道有这些影片可看。和其他平台不同的是,相较于透过使用者本身的社群网路找到推荐内容,精确预测使用者想观看的影片,才是 YouTube 推荐系统成功的关键。
为了做到这一点,首先我们掌握了每个使用者在观看影片时都有自己独特的习惯。然后,系统会将你的观看习惯与类似使用者比较,并根据这项信息推荐其他你可能想看的内容。因此,如果你喜欢某部网球影片,而系统注意到其他喜爱同一部网球影片的使用者同时也喜欢爵士乐影片,可能就会向你推荐爵士乐影片,即使你从未观看任何的爵士乐相关影片 (针对新闻与信息等类别的影片,系统会采取不同的做法,稍后会进一步说明)。几年前,系统向我的大女儿推荐 Tyler Oakley 的影片,因为这是当时许多观看 Vlogbrothers 的使用者也会观看的内容。结果她成为 Tyler Oakley 的忠实粉丝,我们还带她去参加粉丝见面会。
使用者可自行暂停、编辑或删除自己的 YouTube 搜索资料
当然我们也知道,并非所有人都愿意随时与我们分享这项信息。因此我们设计了控制选项,让使用者决定要提供多少资料。这表示你随时都可以暂停、编辑或删除自己的 YouTube 搜索和观看记录。
系统如何提供个性化的推荐内容
为了提供这类个性化推荐内容,推荐系统并不会“照本宣科”以固定方式运作,而是会参考超过 800 亿笔我们称为信号的信息,每日从中学习,不断进化。也因为如此,要实现更高的透明度并非只是列出推荐系统采用的公式这么简单,而是要充分了解反馈至系统的所有资料。系统将透过综合考量下列几项信号,以得知你可能会满意的内容:影片的点击次数、观看时间、问卷调查的答复、喜欢和不喜欢的人数。
- 点击次数:影片点击次数是颇具参考价值的指标,因为点击越多代表越受欢迎。毕竟,谁会点选自己不想观看的内容?
不过,我们在 2011 年发现事实并非如此,因为点选一部影片不代表你确实看过这部影片。举例来说,假设你正在搜索去年温布顿网球赛的精华片段。你边捲动页面边浏览,然后看中其中一部影片,缩图是比赛场景,标题也有提到赛事,但点进去才发现这是某个人在自己房间内谈论比赛的影片。之后你又点选了系统在“即将播放”面板中推荐的影片,结果发现又是另一位球迷在谈论比赛。你一次又一次地点选这些影片,最后系统终于向你推荐你想要观看的影片内容。这就是我们在 2012 年加入“观看时间”的原因。
- 观看时间:指得是你看过哪些影片以及持续观看多长的时间,透过这项个性化信号信息,可以让系统知道你最可能想观看什么样的内容。所以如果有网球迷观看了 20 分钟的温布顿网球赛精华片段,以及短短几秒钟的赛事分析影片,我们就可以放心假设他们更想要花时间观看那些比赛的精华片段。
当我们首次将观看时间纳入推荐系统之后,观看次数的数据立即下滑了 20%。但是我们相信,为受众提供更多价值是更重要的。尽管如此,并非所有观看时间都具有相同的信息价值。有时我会随机播放几部影片直到深夜,但其实我大可利用这些时间在 YouTube 上学习新的语言,或跟著创作者一起精进我的厨艺。我们不希望受众对花在观看影片上的时间感到后悔,所以我们必须更加努力,设法评估使用者在 YouTube 上投入时间所获得的价值为何。
- 问卷调查答复:为实际确认受众对于观看的内容是否满意,我们会评估所谓的“有价值的观看时间 (valued watchtime)”,也就是确认使用者认为观看影片所花费的时间是否具有价值。我们会在使用者问卷调查中请你为观看过的影片评定一到五颗星的分数,并将你的答案做为参考指标,借此衡量你对内容的满意度,进而评估有价值的观看时间。如果影片只获得一或两颗星,我们会询问为何给出偏低的分数;同样地,如果影片获得四或五颗星,我们也会询问你原因,是因为这部影片具有启发性或重大意义?而系统在计算有价值的观看时间时,只会纳入获得四或五颗星的高评价影片。
当然并非所有使用者都愿意为看过的影片填写问卷。所幸我们已根据实际获得的答复,训练出一个机器学习模型,用以预测所有人对问卷调查的可能答复。为测试预测结果的准确度,我们刻意不将部分问卷调查的答复加入训练程序,以持续监控系统是否能密切追踪实际的答复。
- 分享次数、喜欢和不喜欢的人数:平均而言,如果使用者分享了影片或表示喜欢,就代表满意度可能较高。我们的系统会根据这项信息,尝试预测你表示喜欢或分享其他相关影片的可能性。如果你对某部影片表示不喜欢,或许这就是你对这部影片不感兴趣的信号。
不过就像推荐内容一样,每个信号的重要性都取决于你。如果你会分享所有看过的影片,包括那些你给一或两颗星的影片在内,系统在推荐内容时,就知道不必过于加重计算你所分享的影片。基于以上考量,我们的系统并不会依循特定公式运作,而是会随著你的观看习惯动态调整推荐机制。
秉持负责的态度提供推荐内容
点击次数、观看次数、观看时间、使用者问卷调查、分享次数、喜欢和不喜欢的人数等信号信息,在产生音乐和娱乐类别的推荐内容时非常实用,而这些正是大多数使用者前来 YouTube 观看的内容。然而这几年来,造访 YouTube 观看新闻和信息内容的使用者人数也持续成长。无论是最新的即时新闻或复杂的科学研究,这些主题都格外注重信息的品质,前后文的重要性更是不容忽略。一些使用者可能对于宣称“地球是平的”的影片感到非常满意,但这并不代表我们希望推荐这类品质不佳的内容。
秉持负责态度的推荐系统,是我们经营平台不可或缺的重要环节。推荐系统会提供受众优质的信息,并尽可能避免他们看到有问题的内容。推荐系统也有助于落实《社群规范(https://www.youtube.com/howyoutubeworks/policies/community-guidelines/)》的规定,这套规范严谨定义了 YouTube 允许及禁止的内容。
自 2011 年起,我们就开始运用推荐系统防止大量受众接触到品质不佳的内容。我们建构了分类程式来辨识儿童不宜或含有暴力元素的影片,并避免推荐这类影片。随后在 2015 年,我们留意到耸动的小报内容出现在首页上,因此采取行动调降这类内容的推荐排序。一年后,我们开始预测影片是否可能危及未成年人的安全,并将这类影片从推荐内容中移除。同时,为确保推荐系统公平对待弱势族群,我们从 2017 年开始评估并强化系统所采用的机器学习技术的公正性,避免包括 LGTBQ+ 社群在内的受保护团体遭受有害内容的侵扰。
近年来不实信息的盛行,也促使我们进一步扩展推荐系统的应用方式,将有问题的不实信息和游走在违规边缘的内容 (濒临界线但并未明确违反《社群规范》的内容) 纳入其中,这当中包括阴谋论影片 (“宣称登陆月球影片造假”),或其他散布不实信息的内容 (“柳橙汁可以治疗癌症”)。
我们运用分类程式辨识影片是否“具有公信力”或濒临“违规边缘”,以顺利达成上述优化推荐内容的目标。这些分类作业必须依赖评估人员审核各频道或影片中的信息品质。我们在世界各地招募这些评估人员,并依据一套详细且对外公开的分级规范实施相关训练。此外,例如当内容涉及健康信息的时候,我们还会向医师等经过认证的专业人士寻求协助。
为确定影片的公信力,评估人员必须确认一些关键问题:内容是否提供所承诺的信息或达成预定目标?达成影片预定的目标需要具备哪些专业技能?影片主讲人及所属频道的信誉如何?影片的主题为何 (例如:新闻、运动、历史、科学等)?内容是否以讽刺为主要目的?一部影片是否具有公信力将取决于以上这些问题的答案。如果是新闻和信息内容类别的影片,上述分数越高,影片获得推广的机会就越大。
为判定影片是否为违规边缘内容,评估人员考量的因素包括但不限于:内容是否不准确、是否涉及误导或诈欺、是否未顾及他人感受或包容性低,以及是否有害或可能造成危害。系统会综合以上结果计算分数,据以判定影片是否内含有害的不实信息,或者是否为违规边缘内容。任何被归类为违规边缘的影片,推荐系统都会调降该影片的排序。
接著这些人工评估结果能帮助训练系统建构决策模型,这样我们就能将他们的评估结果扩大套用至 YouTube 平台的所有影片。
回应有关推荐系统的常见问题
(https://www.youtube.com/watch?v=_geqgdIfsaM)
推荐系统在整个社群中扮演关键的角色,不仅能建议受众观看他们喜爱的内容,还能协助创作者触及新受众。对整体社会大众而言,推荐系统在协助防范有害不实信息散播上具有重大意义。我们承诺坚守对于 YouTube 社群和社会大众的责任,因此就算点击次数、观看时间、使用者问卷调查答复、喜欢和不喜欢的人数等因素是系统获取信息的重要信号,若与我们的承诺有所抵触,也会不予采纳。
另外还有一些关于推荐系统的常见问题,我认为有必要在此回应:
违规边缘内容是否能获得最高参与度?
事实上,根据问卷调查结果和意见回馈,我们发现多数受众不希望系统推荐违规边缘内容,甚至有许多人觉得这类内容令人不愉快或甚至反感。当我们将猥亵性质或类似小报的内容调降排名之后,相较未实施任何限制的期间,观看时间在 2 个半月内反而成长了 0.5%。
此外,目前也没有任何证据显示违规边缘内容平均获得的参与度高于其他类型的内容。以主张地平说的人士发布的内容为例,虽然在所有上传的影片当中,地平说影片的数量远远超过地圆说影片,但平均而言,地平说影片获得的观看次数显然较少。问卷调查显示,YouTube 上只有极小部分的使用者对违规边缘内容感到满意。我们已投入大量时间及资金,确保这类内容不会透过我们的推荐系统触及更广大的受众群。如今,违规边缘内容获得的观看次数绝大多数来自非订阅推荐以外的来源。
违规边缘内容是否有助于增加 YouTube 的观看时间?
对于绝大多数的使用者而言,在 YouTube 上观看违规边缘内容并不能算是善用时间。基于这个原因,我们在 2019 年首度开始调降违规边缘内容在推荐系统中的排名。当时在美国,未订阅频道的使用者经由系统推荐观看违规边缘内容的时间随即就减少了 70%。如今,经由系统推荐观看违规边缘内容的比例远低于 1%。
推荐系统是否会建议受众观看日益极端的内容?
如我先前所解释,我们会主动调降品质不佳的信息在推荐系统中的排名。但我们也会采取额外行动,针对受众可能感兴趣的主题,向他们推荐具有公信力的影片。比如说,当我观看一部关于 COVID-19 疫苗的影片,我的“即将播放”面板中就会显示如 Vox 和 Bloomberg Quicktake 等值得信赖的来源提供的影片,而不会出现内含误导性疫苗相关信息的影片(在系统可侦测的范围内)。
除了这些 COVID-19 新闻和解说影片以外,系统还会根据我个人的观看记录,向我推荐其他主题的内容,例如 Saturday Night Live 的喜剧小品,或一场关于超级玛利欧效应的 TEDx Talk。这类多元的个性化建议能协助受众接触新的影片主题和形式,而非一再重复观看相同类型的影片。
越来越多独立研究人员开始探究科技平台对于违规边缘内容的观看数有何影响。虽然目前研究仍持续进行中,但近期发布的报告指出,YouTube 推荐系统实际上并未引导受众观看极端内容。YouTube 上新闻和政治性内容的观看数更能普遍反映出受众的个人偏好,与他们的网路使用习惯相呼应。
违规边缘内容是否能营利?
首先,我们的《广告客户青睐内容规范(https://support.google.com/youtube/answer/6162278?hl=en)》已禁止许多游走在违规边缘的内容从事营利活动。许多广告客户也向我们反应,不希望在 YouTube 上与这类内容有任何关联,并经常选择排除在这类内容中放送广告。这代表每一次有人观看违规边缘影片,频道就会错失一次营利机会,进而导致 YouTube 收益产生实质损失。同样地,这类内容不仅降低信任感,同时也让人们对于广告合作伙伴,以及一般大众、媒体和政策制定单位产生疑虑。事实上,由于我们采取更多行动善尽自身的责任,因此 YouTube 及整体创作者经济也随之成长。善尽责任有助于业务成长。
既然如此,为什么我们不直接移除违规边缘的内容?有别于kong bu主义或儿童安全等范畴,不实信息不仅变化及演进的速度快得惊人,且往往缺乏明确的定义。此外,不实信息也可能因个人观点和背景而异。我们认知到,有时必须与具有争议或甚至是令人反感的内容共存。因此我们将持续以建构负责任的推荐系统为首要目标,并采取实质行动,防范系统广泛推荐这类内容。
综合以上所述,我们为善尽自身责任而针对推荐系统所投入的一切努力,已产生具体的影响。具公信力的新闻内容观看时间大幅增加,而违规边缘内容的观看时间则明显下降。这不代表我们已解决问题,而是意味著我们必须不断修正并投资我们的系统,精进再精进。我们的目标是将经由系统推荐观看违规边缘内容的次数,降低至 YouTube 整体观看次数的 0.5% 以下。
YouTube 的使命是赋予每个人向世界发声的机会,我家人的生活也因为 YouTube 出现极大变化。我的大女儿看了有助培养包容态度和同理心的影片内容后,性格上产生了深远且正面的影响;我儿子因此顺利突破线性代数课程的学习瓶颈;而我也从科技伦理领袖的演说中学习到相当多的知识和这领域的奥妙之处。我们对于开放原则的坚持已催生出新的声音和构想,这是在其他平台难以实现的成果。包含 Marques Brownlee、MostlySane 或 NikkieTutorials 在内的创作者,也透过他们的专业技能、理念主张及真诚态度,启发了数百万受众。
由于各位不吝赐教,提供各种宝贵意见,我们的推荐系统才能日益完善,但眼前仍有许多进步空间,因此我的团队和我将不遗馀力,继续做好我们的工作,提供最实用且深具价值的体验。
原创文章,作者:图帕先生,感谢支持原创,如若转载,请注明出处:https://www.yestupa.com/youtube-recommendation.html