群组推荐实现流程及其应用场景分析

客户世界 | 2022年9月5日 | 2022年, 客世原创 | 评论已关闭 | 2287

现代社会是一个高度信息化、数字化的社会，由于面临巨量的数据，用户在处理信息的能力方面大大受限，所以用户对信息的利用率反而降低了；而推荐系统可以根据用户需求和偏好为用户推荐其感兴趣的信息，从而提高信息利用率。早期个性化推荐系统蓬勃发展，被大规模应用于影音娱乐、电子商务、搜索引擎等领域，但也面临着数据稀疏以及算法计算量大等问题。群组推荐作为个性化推荐系统的进一步延伸，逐渐成为专家学者们研究的热点。相较于以单个用户为主要应用对象的传统个性化推荐来说，群组推荐考虑了群组偏好对推荐结果的影响，所以在一些需要考虑偏好的群体因素影响的日常活动场景中，如驴友相约旅游、朋友聚餐、家人一起看电影等活动，群组推荐更加合适且具备优势；同时群组推荐算法可以在一定程度上解决推荐算法过于复杂以及数据稀疏等问题。

本文对群组推荐相关的文献进行梳理，整理得到群组推荐的实现流程图，具体步骤可分为偏好获取、群组划分、偏好融合和预测推荐四步；然后对群组推荐四个不同的步骤进行详细描述，主要包括其目的、实施的过程以及方法；最后对群组推荐的应用场景进行了分析。

一、群组推荐的实现流程

个性化推荐关注的是单个用户，而群组推荐是为群体用户提供推荐服务，二者存在本质差别，因此群组推荐的实现流程与传统的个性化推荐十分不同。群组推荐的每一个群组中有众多用户，不同的用户之间偏好需求会存在差异，群组推荐算法的最终目的是满足群组成员间不同的偏好需求。在对群组推荐系统的相关文献进行梳理后，本文将群组推荐的具体实现流程归纳为图1所示的四步。首先需要完成用户偏好获取阶段的任务，在推荐算法中一般将偏好定义为用户对两个及以上项目的排序关系；其次是群组划分阶段，其基本思想是将偏好相似度高的用户构成一个群组；然后是用户偏好融合阶段，该阶段的目的是获取群组偏好，即需要在每个群组成员不同偏好的基础上，通过偏好融合策略生成最终的群组偏好；最后，是群组推荐结果的展示阶段并对推荐结果进行评估。

图 1 群组推荐实现流程图

二、群组推荐的具体步骤

步骤一：用户偏好获取

不论是传统的个性化推荐还是群组推荐，都需要用户偏好作为后续推荐工作的数据支撑，优质准确的用户偏好信息在后续推荐过程中可以起到事半功倍的效果。群组推荐的特别之处在于需要获取并融合群组内成员的偏好，在群组推荐过程中如果只满足单个或者部分群组内成员的偏好需求是远远不够的，这对用户偏好信息数据的质量提出了更高的要求。

目前，完成用户偏好获取任务可以通过显式用户偏好信息获取和隐式用户偏好信息获取两种不同的方式。1）显式用户偏好信息获取是直接提取用户主动提供的信息数据，这类信息数据包含用户明确的偏好信息，例如用户对项目的评分、点赞、收藏等数据。但是，随着社会公众隐私数据保护意识的增强，部分用户在提供显式偏好信息时会有所顾虑，配合意愿也相对降低，因此会造成偏好信息数据稀疏以及质量不佳的问题。2）隐式用户偏好信息获取则不需要用户主动配合，而是将用户日常活动中积累的历史行为数据作为数据支撑。这一获取方式需要程序和平台在运行过程中设置合理的数据埋点，以此获得关键节点的用户行为数据，例如用户浏览的项目数量、时间等数据，然后通过对用户行为数据进行分析等方式获取偏好信息。但该方法需要事先积累大量的用户历史行为数据，对平台的数据算力和分析能力具有较高的要求，而且用户的历史行为数据中可能存在部分噪声干扰需要加以辨别。

步骤二：群组划分

群组推荐的第二步也是关键一步就是基于未分组的用户偏好信息进行群组划分。群组推荐是为群组用户提供推荐服务，因此群组划分结果的好坏至关重要，通过合适的群组划分方法得到相似度高的群组，可以为该群组提供更加优质的群组推荐服务；同时群组推荐后续的偏好融合工作完全基于群组划分的结果，群组内成员聚合度越高则越可以融合出代表性高的群组偏好。在群组划分过程中需要考虑的因素越来越多，不仅包括群组的大小、群组内凝聚力、群组内成员关联强度等，还需要考虑数据集属性以及相应的应用场景等因素。

目前，可以从群组推荐的相关文献中总结出以下三种群组划分的方式：基于规则、基于内容以及基于相似度的群组划分。1）基于规则的群组划分方法主要通过关联规则或者信任关系等探索具有某种内在联系的群组，推荐可行度较高且可解释性较强，但该方法需在事先指定的规则中进行，不能随意调整以及面临未充分利用用户偏好信息数据的问题；2）基于内容的群组划分方法将标签内容等信息融入群组划分方法，例如用户的个性化标签以及社会属性标签等内容，然后将不同的用户划分至拥有不同标签属性的群组中，划分结果明确且具备可解释性，但该方法需要大量高质量的描述性信息作为前提保证，实现过程中耗时耗力难度较大；3）基于相似度的群组划分方法对原始数据的要求较少，常用的算法是聚类算法，例如K-Means聚类、密度聚类等算法，其基本原理都是将相似度较高的用户划分到同一群组内从而保证后续的群组推荐效果，同一组内的相似度越高，群组推荐的效果就越好。

步骤三：用户偏好融合

群组推荐的结果需要建立在群组内所有成员的偏好信息之上，所以在群组划分结束后，为了后续推荐算法的实施需要获取代表群组内成员偏好的共性偏好。群组推荐的第三步就是用户偏好融合，即根据群组成员的偏好提取群组偏好。提取群组共性偏好的原则就是协调群组中每个成员的意愿，尽可能缩小用户间偏好的差异。

用户偏好融合主要分为偏好融合策略和偏好融合方法两个独立的部分。1）偏好融合策略包括普通融合策略和加权融合策略：普通融合策略中使用比较广泛的有公平策略、最受尊敬者策略、最小痛苦策略和均值策略，基本思想是根据事先设定的规则将不同的用户偏好或者针对个人用户的推荐结果聚合起来。加权融合策略根据加权方式又分为静态加权和动态加权，静态加权偏好融合策略只考虑静止状态下用户的基本特征数据或者用户历史行为数据，然后赋予不同的固定权重给用户；如果关注用户权重的动态变化情况则是动态加权偏好融合策略，该策略赋予的权重会随着群组成员间的交互情况改变而改变，具体方法主要有遗传算法、纳什均衡策略以及注意力机制等。2）偏好融合方法根据融合发生的阶段以及融合的具体内容，可以概括为模型融合方法和推荐融合方法，如图2所示。模型融合方法是先融合后推荐，该方法的融合对象为群组内不同成员各自的偏好信息，而推荐过程是针对群组偏好进行；但推荐融合方法的过程则恰恰相反，先推荐后融合，融合对象不再是用户偏好而是针对单用户的推荐结果。

在实际应用中，需要根据不同类型的群组特征选取适合的偏好融合策略以满足群体成员的总体满意度以及推荐的公平性，两种偏好融合方法也有各自的优劣势，模型融合方法的缺点是过于关注共性偏好会造成群组成员间的不公平性问题，而关注了群组内所有用户个性化偏好的推荐融合方法则忽视了群组成员间的交互行为。

图 2 模型融合方法与推荐融合方法流程对比图

步骤四：预测推荐

群组推荐的最后一步就是根据群组共性偏好为群组用户生成推荐列表，然后根据需要对生成的推荐列表进行效果评价。群组推荐的最后一步与传统个性化推荐比较相似，其预测推荐方法基本是由传统的个人推荐方法演变而来。经常使用的推荐方法有基于协同过滤的推荐、基于内容的推荐和组合推荐。协同过滤( Collaboration Filter，CF) 推荐是推荐方法中的主流，它的主要思想是“物以类聚、人以群分”，协同过滤具有良好的可扩展性，但在数据稀疏和冷启动时存在效果下降的问题。基于内容的推荐( Contentbased，CB) 是根据用户偏好的项目，通过计算项目内容之间的相似性，推荐给用户可能感兴趣的项目。基于内容的推荐具有很强的可解释性，不存在数据稀疏性问题；但是推荐的内容过于一致，并且也存在冷启动问题。由于每一个单独的推荐方法都有自身的局限性，为了使推荐效果更佳，将推荐方法混合形成了混合推荐方法；混合推荐可以扬长避短，比如将基于内容的推荐与协同过滤结合，可以缓解协同过滤数据稀疏性问题。

效用评价对于检验组推荐系统的性能和发现其存在的问题来说十分重要，是组推荐系统研究中不可忽视的环节。常见的效果评价指标包括准确度、用户满意度、多样性、覆盖率、惊喜度等等。其中，群组推荐的准确度是比较重要的评价方面，准确度评价主要用到的评价指标有RMSE、F1、Recall、Precession和AUC等。

三、群组推荐的应用场景

群组推荐在个性化的基础上同时满足多用户的偏好需求，使其具有广阔的应用前景，可以应用于旅游、餐饮、娱乐、电子商务、教育推荐等领域。随着交互式互联网的发展以及在线社区活动的频繁出现，关于群组推荐应用场景的研究越来越深入。

在旅游推荐方面，群组推荐可以大展身手，因为当人们结伴出行时旅游目的地的选择是一个棘手的问题。每个人因为年龄、阅历以及偏好不同，他们所期望的旅游目的地大不相同，因此群体旅游时必须充分考虑到每一个游客的需求来选择旅游景点和路线。利用群组推荐流程中显式获取用户偏好的方法，在选择目的地之前将旅游景点信息分为多个特征属性供用户进行评分；然后根据用户偏好和群组用户个人特征将群组进一步划分为多个偏好相似的子组；最后采用偏好融合策略，根据子组偏好的重要程度为子组分配不同的权值，再进行旅游目的地和路线推荐，可以最大程度满足群组内不同成员的旅行偏好。

为外出用餐的群组用户推荐合适的餐厅也是群组推荐模型的一个应用场景。在给群组用户推荐餐厅时，需要考虑不同用户的饮食偏好和口味习惯。首先可以对餐厅进行细分，提取不同种类餐厅的特征；然后运用群组推荐中偏好获取的方法收集群体用户对餐厅特征的评价；最后融合用户对餐厅类型的偏好程度，不断为群组用户进行餐厅推荐，直到生成的推荐结果满足所有群组成员偏好；另外将群组用户间的信任关系融入餐厅群组推荐模型内，可以改善群组推荐的性能，从而提高群组用户的推荐结果满意度。

在娱乐推荐领域，群组推荐可以运用于图书、电影、音乐等项目的推荐中。为群组用户推荐图书时，可以从图书评论角度出发比较不同类型图书属性的权重，将用户群组与图书群组相互匹配不仅可以提高图书推荐的有效性，还可以提高群组推荐系统的用户隐私安全。对于有群体观影需求的群组用户来说，群组推荐模型可以通过计算群组用户对不同电影项目评分的标准差，然后选取推荐列表中评分标准差较小的项目作为群组推荐项，从而解决不同群组成员之间电影偏好差异较大的问题。在公共场合播放音乐时，需要音乐群组推荐模型来解决不同听众音乐偏好需求存在差异的问题，群组推荐中隐式偏好获取的方法可以从用户的音乐播放行为中获取音乐偏好，进行偏好融合后获取群体偏好再为群体用户推荐音乐项目，同时将情感因素加入模型中可以提高群组推荐满意度。

本文对群组推荐的实现流程进行了详细的介绍，群组推荐相较于针对单个用户推荐的个性化系统来说，可以获取群组内成员的共性偏好并通过偏好融合策略缓解不同成员间的偏好差异，从而使得推荐结果尽可能满足所有群组成员的偏好需求，因此群组推荐系统可以广泛应用于旅游、餐饮、娱乐等多个领域。总结全文可知，群组推荐共包括用户偏好获取、群组划分、用户偏好融合以及预测推荐四个步骤，其中群组划分和偏好融合两个步骤是群组推荐的特色和关键之所在。

作者：郭红丽邓雯麒，来自厦门大学经济学院。

本文刊载于《客户世界》2022年8月刊。