摘要:随着电子商务的飞速发展,电商平台上的在线商品评论成为消费者在线购物时做出购买决策的重要参考,同时也是平台商家获取在线消费者真实关切的重要信息来源。然而,海量的良莠不齐的在线商品评论使得消费者和商家很难从中获取有价值的高质量信息。一方面,本文在经典的主题分析LDA模型的基础之上提出了一种基于评论有用性的主题分析模型,即Help-LDA模型。相比与假定每条评论具有同等重要程度的LDA模型,Help-LDA模型根据评论有用性对不用评论赋予不同的权重,进而从有用性较高的评论中抽取出对于消费者更有用的决策信息。另一方面,本文基于Help-LDA模型提出了新的评论文本表示方法,并结合SVM方法进行评论有用性预测。通过收集大众点评网站在线评论进行的实验表明,Help-LDA模型能够从电商评论中高质量抽取在线消费者对于商家商品和服务的真实关切。并且基于Help-LDA模型的评论文本表示结合SVM方法能够显著提升在线评论有用性预测性能。
关键词:在线商品评论;主题分析;评论有用性;评论主题提取;有用性预测
一、研究背景和意义
电商平台上的在线商品评论已经成为消费者购买决策和商家商品和服务改进的重要决策参考。一方面,当消费者网上购物时,他们往往会参考其他已购买者发布的评论信息而做出购买决策。另一方面,当商家在进行商品和服务改进时,他们会通过在线商品评论去了解顾客需求并为他们的新产品开发设计提供新的思想。通过积极将用户引入新产品和服务的开发过程之中实现协同创新,商家以此持续获得可靠的市场竞争优势。不仅如此,商家也能通过在线商品评论获取更多的有关市场结构和竞争态势方面的知识以为他们的营销决策提供决策支持。然而,海量的在线商品评论为在线消费者和商家利用在线商品评论带来了严重的信息过载问题。当消费者和商家面对巨量的在线商品评论时,他们很难在有限的时间内从中获得那些对自己具有决策价值的信息。由于海量在线商品评论在信息质量上的良莠不齐,使得消费者和商家更加难以依靠有限人力去粗取精、识别高质量的决策信息。由此,一系列自动化方法被提出以辅助消费者和商家从海量的在线商品评论中识别对其决策有用的信息。现有方法通常将在线商品评论有用性预测视作为文本分类问题,进而在此基础之上提取在线商品评论的词项特征、情感特征和语言学特征等进行文本表示,并使用线性回归或机器学习算法来预测其对于消费者和商家决策的有用性。
现有方法在评论有用性预测时将评论文本视作为由相互独立词项组成的词袋(Bag of Words)而忽略了在线商品评论中广泛存在的由词项分布组成的评论主题(Review Topics)。一方面,词是最小的语言单元,词项语义依赖其出现的上下文一系列潜在语义方法被提出以从概念主题(Conceptual Topic)角度理解词项语义,例如LSA方法、pLSA方法和LDA方法等。因此,词项特征相比于概念主题特征缺少相应的评论有用性预测模型的语义解释能力。另一方面,对于消费者和商家来说,他们除了需要获取对其决策有用的评论之外,也更加希望了解包涵在有用性评论中的评论主题,以帮助其了解已购买商品的消费者的真实关切。由此,本文在经典的LDA模型基础之上,考虑评论的有用性,提出Help-LDA主题分析模型以从在线商品评论中进行抽取消费者关注的有用性评论主题,并在此基础上提出基于Help-LDA的在线商品评论表示方法以进行预测其有用性。通过收集大众点评网站在线评论进行的实验表明,Help-LDA模型能够从电商评论中高质量抽取在线消费者对于商家商品和服务的真实关切。并且基于Help-LDA模型的评论文本表示结合SVM方法能够显著提升在线评论有用性预测性能。
二、基于评论有用性的LDA扩展主题分析模型
3.1 Help-LDA主题模型
LDA主题分析模型的基本假设为每条评论的重要程度都相同。然而,具体对于评论有用性而言,单个评论的有用性各不相同。Help-LDA模型的基本思想是依据评论有用性赋予评论不同权重,然后从评论中进行主题抽取,以期望能够优先从有用性较高的评论中的抽取出消费者较为关注的主题。本文以图1所示的餐馆评论中的以下四个句子为例。
图1 餐馆评论的四个例句
图1中的四个句子中可分为三个主题,即“food(食物)”,“bread(面包)”,“waiter(服务生)”。由于词项“food(食物)”分别出现在两个句子中,所以其会被经典的LDA模型视作为具有较高概率出现在某个主题的前列。然而,消费者和商家可能会认为有关“bread(面包)”的评论信息会对自己的购买和服务改进决策更加有用。因此,本文提出的Help-LDA模型通过将“bread(面包)”的有用性考虑在主题模型中来提取相应的主题,以突出评论信息主题对于消费者和商家决策的有用性。如图2所示,Help-LDA模型在LDA模型的基础上引入了评论的有用性 ,评论有用性等级越高, 值就越大。与LDA模型相比,Help-LDA模型将评论的有用性 传递到词项的有用性上,进而从评论中抽取有用性主题。
图2 Help-LDA模型概率图
3.2 数据集
本文的试验包括两个方面的任务: 一是通过比较Help-LDA模型和经典的LDA模型在主题分析上的表现,以考察Help-LDA模型对于评论主题分析的实际效果;二是通过比较利用Help-LDA模型和经典的LDA模型进行的文本表示,以及其它相关扩展模型在评论有用性预测上的实际性能,来考察Help-LDA模型对于评论有用性预测的实际效果。为开展上述比较实验、即评论主题分析和有用性预测,本文开发了网络爬虫从大众点评网站上收集了两家餐厅的实际评论数据,包括基本信息、评论者ID、评论时间、评论内容和评论被点赞次数。实验所选择的餐厅A和餐馆B分别是非高档和高档美食餐厅的代表,两个餐厅的基本信息较为相似,仅在人均消费上存在较大差异。为了避免最新评论的点赞次数较少引起的实验结果偏差,本文选取距离数据收集时间一个月以上的评论作为实验数据集,一共分别收集两个餐馆各2,000条评论。
三、实验结果与政策建议
在餐厅A的评论上,LDA模型下主题1“食品”和主题2“味道”中各个词的概率相对较低(均小于10%),而在Help-LDA模型中,主题1“食品”和主题2“味道”中词的概率均有明显上升。在主题1中,“东坡肉”的词项概率由6。75%提升到15。43%。在主题2中,概率最高的词由“味道”变为“口味”。主题3由LDA模型中的“服务”变为了Help-LDA模型中的“其他”,这表明在该餐厅有用性评论中,“食品”和“味道”是被消费者更加关注的主题,而“服务”是被消费者较为次要被关注的主题。在餐厅B的评论中,LDA模型下主题1“食材”和主题2“环境”中各个词的概率相对较低。而在Help-LDA模型中,主题1“食材”和主题2“环境”中的词的概率均有明显上升。主题3由“服务”变为了“其他”,同样表明在该餐馆有用性高的评论中,“食材”和“环境”是被消费者更加关注的。由于本文选择的两家餐厅在大众点评上均具有较高的星级,其服务水平有一定保证,因此,消费者更加愿意关注餐厅的“食品”、“食材”、“味道”和“环境”。
在LDA模型中,三个主题尽管重要程度略有差异,但是相差很小,导致消费者和商家很难判断哪个主题较为重要。而从Help-LDA模型中可以很清晰的观察到,餐厅A中的食品和口味具有很高的重要性,表明消费者更关注的是该餐馆“吃”的方面,而对于服务、环境等因素关注度则较小。因此,对于餐厅A来说,在经营活动中应该将更多的投入放到食品上,以提高菜品质量和口味。但是,对于餐厅B来说,消费者的关注点有明显的区别,当评论中包含对餐馆环境的描述时往往能得到更多的点赞。餐厅B的消费者群体首先关注餐厅的就餐环境,其次是食材,对于服务等其余方面关注则较少。因此,对于餐厅B来说,其投入应该放在餐厅的环境布置和菜品质量,以此提高客户的满意度。餐厅A的人均消费属于大众水平,而餐厅B的人均消费这属于中上水平。因此,前者的消费者更加关注食品和口味,而后者则更加关注就餐环境和食材质量。
在线口碑试图利用在线商品评论来帮助消费者做出购买决策并且帮助商家了解消费者对于商品和服务的关切以进行商品和服务质量改进。然而,如何从海量的在线商品评论中挖掘对于消费者购买决策和商品质量改进最为有用的信息已经成了工业界和学术界最为关注的焦点。本文从评论有用性角度出发,在经典的主题分析LDA模型的基础之上提出了一种基于评论有用性的主题分析模型,即Help-LDA主题分析模型。该模型将词项在评论中的出现次数赋以评论有用性权重,然后利用经典的文档主题生成和主题词项生成过程来抽取有用的词项主题分布和主题评论分布。进而,本文提出了新的基于Help-LDA的评论文本表示方法,并结合SVM进行评论有用性预测。考虑到传统的LDA模型在利用主题模型进行文本表示时所提取的特征较少而不能发挥SVM对于处理高维数据的优越性能。本文提出的基于Help-LDA的评论文本表示方法将词项在有用性主题上进行扩展表示,以增大利用有用性主题进行文本表示的信息量。
四、边际贡献与未来拓展
本文收集来自大众点评的两个餐厅(餐厅A和餐厅B)的实际在线商品评论数据验证本文提出的Help-LDA模型对于评论有用性主题分析和评论有用性预测上的效果。实验结果表明,相比于经典LDA主题分析模型,Help-LDA模型在JSD、困惑度、连贯性方面具有较好的效果。它通过在线商品评论中主题词项分布以及评论主题分布抽取有用主题及该主题下的主要词项,以从海量电商评论中挖掘出消费者对于商品和服务关切的高质量信息。通过与经典的LDA模型结合SVM、Labled LDA方法、Supervised LDA方法和DiscLDA方法的实际比较,结果表明Help-LDA模型结合SVM能够显著提升评论有用性预测的准确率。
尽管本文所提出的Help-LDA模型能从在线商品评论中抽取出有用主题以提升现有的评论有用性预测,然而,本文的工作也存在一定的局限性。本文在提出Help-LDA模型时,有用性参数的设定具有一定的主观性。对于不同的数据集,有用性参数的设定方法可能有所不同。在未来的工作中,本文将进一步探究如何针对不同的数据集和实际应用场景对评论有用性参数进行具体设定。此外,本文将进一步在有用性词项和主题的基础上,研究从在线商品评论中抽取消费者对于商品和服务的细粒度观点。通过比较消费者对于不同商品和服务关于评论主题的不同观点,进而帮助消费者进行精准决策和商家商品和服务改进。
本文摘编自《系统工程理论与实践》第42卷第10期论文《在线商品评论有用性主题分析及预测研究》(点击题目链接全文);
作者:张文1,博士,教授;王强1,博士研究生; 杜宇航2,硕士;聂锟3, 博士,副教授;李健1,博士,教授
1. 北京工业大学 经济与管理学院, 北京 100124;
2. 中国民航信息网络股份有限公司 大数据技术部, 北京 101318;
3. 浙江工商大学 工商管理学院, 杭州 310018