首页 > 论文范文 > 社科论文 > 一种基于用户行为特征的个性化酒店推荐模型_免费论文全文下载

一种基于用户行为特征的个性化酒店推荐模型_免费论文全文下载

申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。

【摘要】随着互联网技术的迅猛发展,我们与互联网的联系也变得越来越密切,每个人在互联网上的行为都会被作为日志记录下来,由此引发了数据量的爆炸式增长并且带领我们进入了大数据时代。众所周知这些海量日志数据中蕴含着巨大的商业价值,而如何从这些海量的用户行为日志中挖掘出每个人的个性化喜好特征,以实现数据的商业价值转化则是目前最热门也是最值得研究的互联网技术之一。针对目前推荐系统普遍精准度较低的问题,本文提出了一种基于用户行为特征的酒店推荐模型,对传统的推荐算法进行了一定的改进,通过使用某著名酒店预订公司的后台数据进行实验之后,证明该模型能够有效的提升推荐质量。

【关键词】推荐系统;行为特征;数据挖掘;个性化推荐;电子商务
引言
电子商务伴随着近几年移动互联网的蓬勃发展,深刻的改变了人们的传统生活和购物方式,但是人们在享受互联网所带来的便利的同时也面临着信息爆炸带给自己的烦恼,即无法从海量的商品数据中选择自己真正需要的商品,传统的解决方式是利用搜索和类目索引进行检索过滤,没有个性化的考虑无法很好的解决信息爆炸的问题[1],所以我们采用主动个性化推荐的方式来解决该问题,通过对用户行为特征进行分析,建立用户个性化模型档案,然后向用户进行个性化精准推荐,帮助用户完成购买过程。目前已经有很多经典的推荐算法被提出并应用到实际推荐系统中去,如基于内容的推荐[2]、基于协同过滤的推荐[3]、基于神经网络深度学习的推荐以及基于多种算法的混合推荐等,他们有各自的优点但是也存在很多的不足。本文提出一个新型的基于用户行为特征的个性化推荐模型,并基于真实的酒店预订公司日志数据进行试推实验,实验结果证明该模型能有效提升推荐精准度和用户召回率。
1.推荐模型总体推荐流程
推荐模型总体推荐流程如图1所示:(1)根据酒店基础数据生成酒店基础标签,包含酒店级别、酒店所在区域、酒店服务和酒店房型价格;(2)对于公共组实时发来的UID进行有效性筛选,比如判断其邮箱地址是否有效等,然后根据筛选后的UID的搜索浏览记录,计算出该UID的行为对酒店各特征值的兴趣度,最后生成UID用户行为对酒店特征值兴趣度模型;(3)根据用户最后浏览页的酒店所在城市,对酒店基础标签集进行筛选,得到特定城市的酒店基础标签,然后将其与用户行为兴趣度模型进行匹配评分,得到用户酒店综合评分表;(4)根据用户基础信息及订单记录生成用户基础特征标签,对第三步中生成的用户酒店综合评分表进行精准度修正;(5)根据修正后的用户酒店评分表算出用户的评分最高的9家酒店,并根据这些酒店特征属性计算出EDM邮件的Title关键字;(6)根据用户搜索浏览记录和相应发送时间生成算法生成发送时间。
2.推荐模型关键算法设计
2.1 用户群体筛选规则
根据所作的统计,点击次数在10~50次之内的用户虽然少,却是最有可能下订单的用户(概率在15~30%之内),超过100的则数据紊乱,很可能是网络爬虫之类。故这里将点击次数在10~50次的用户筛选出来作为进行评分的用户群体。
2.2 用户行为
用户行为定义为用户在web页面上的操作,每次操作会对用户给酒店的评分进行一次累加(累加值根据操作不同而不同)。用户行为包括搜索和浏览,搜索行为定义为Usearch(),搜索中添加价格区间,表示关注价格,其传入的参数为价格区间price,即Usearch(price),price=(minPrice,maxPrice)。浏览酒店详情页面行为定义为Uview(),参数为Hotel,即Uview(Hotel)代表用户对该ID酒店所具有的特征感兴趣。订单表示的是用户历史行为,故在用户基础标签中使用,这里不再做分析。表示用户某种行为次数的函数为num(),参数为Usearch()和Uview()。
2.3 用户行为对酒店特征值评分
用户行为对酒店特征值的兴趣评分分为两个部分,一是用户不同行为对于酒店特征值的累加分值,表示为score,其取值区间为[0,+ ∞);二是将score标准化后的评分,表示为rating,其取值区间为[0,1]。
2.4 累加分值score计算规则
对于不同的酒店特征值有不同的累加分值计算规则。
(1)用户行为对酒店级别累加分值
酒店级别划分为4个区间,分别为2星及2星以下,3星,4星,5星,对于i星级酒店的兴趣度累加分值Star_i_Score计算规则如下:
①每天计算当天兴趣度累加分值前均为0;
②每次Usearch(star_i)行为,对于Star_i_Score进行2次累加;
③Usearch(star_i)+Usearch(star_j)行为,对于Star_i_Score和Star_j_Score都进行2次累加;
④用户每次Uview(Hotel.star=i)行为,都对Star_i_Score进行2次累加(Hotel.star=i表示该酒店星级为i);
⑤则Star_i_Score=2*num(Usearch(star_i))+num(Uview(Hotel.star=i)),Star_i_Score范围为[0,+ ∞)。
(2)用户行为对酒店价格累加分值
用户行为对酒店价格的兴趣度累加分值对于Price_i价格区间的兴趣度累加分值Price_i_Score的计算规则如下:
①每天计算当天兴趣度累加分值前均为0;
②用户每次Usearch(price)行为,可以获得该price(minPrice,maxPrice)的价格区间向量α;
③用户每次Uview(Hotel)行为,可以根据该酒店的价格区间向量获得期望的价格区间向量β; (3)用户行为对酒店区域累加分值
ZoneScore生成规则如下:
①每天计算当天兴趣度累加分值前均为0;
②用户每次Usearch(Zone=i)行为可以为编号为i的商圈累加2次分值;
③用户每次Uview(Hotel.Zone=i)行为可以为编号为i的商圈累加1次分值(Hotel.Zone=i表示该酒店属于标号为i的商圈);
④ZoneScore(zone=i)=2*num(Usearch(zone=i))+num(Uview(Hotel.Zone=i))。
3.实验结果与分析
3.1 特征集及试推说明
我们分析的对象是当天浏览搜索的用户并且下订单,以及当天浏览搜索的用户当天未下订单但在未来10天之内下了订单。实际的用户订单特征与推荐出的top9在hotelid,star,price,zone,part和对应项相同,则算一次命中。其中part为zone的根据zone各种特征,如文化,消费等做的聚类,用来比较不同特征集下的试推结果。
3.2 试推结果
Tuser==0为当天下订单的用户;
Tuser==1为未来十天下订单的用户;
Tuser==2为未下订单的用户。
表2为各特征值命中率情况。
表2
Date Star Price Zone Part
05-13 89.75 90.42 81.68 88.57
05-14 88.16 91.71 85.11 88.83
05-15 87.92 91.44 86.74 89.93
05-16 88.31 91.27 84.29 87.78
05-17 88.22 90.60 83.12 86.62
05-18 90.85 94.20 88.17 90.40
05-19 89.72 92.23 84.21 88.57
综上所述,我们认为该模型有很理想的命中结果,但是我们的样本数据还是很有限的,以后还要更多的数据来做进一步的比较两种特征集下的命中结果,用来最好的匹配模型。
4.结束语
推荐系统在电子商务行业以及其他相关行业的各种应用上取得了前所未有的进步,深刻的改变着传统的营销推广方式。当前传统的推荐算法和推荐模式虽然有效但是也存在很多的不足之处尚待改进,随着这些问题的逐步解决,推荐系统也将会为用户提供更完善更有效的信息获取体验。在日趋激烈的竞争环境下,精准营销推荐系统能有效保证用户群,提高电子商务网站营销转化率,成功实施后必将产生巨大的经济效益。
参考文献
[1]杨帆.基于数据挖掘的电子商务个性化推荐技术研究[D].西安电子科技大学,2008.
[2]王宏宇.商务推荐系统的设计研究[D].中国科技大学,2007.
[3]丁二玉.基于web挖掘的web个性化技术研究[D].南京大学,2004.

本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。QQ:522-52-5970