“我老说你是小白脸?难道你不是吗?难道你要告诉我,你是她的男朋友?帅哥别逗了,陈墨香那么有钱,会找你这样一无所有的男人?除了你是她包养的小白脸,我实在想不出你们还能是什么关系?”芳丽晴用那染着鲜艳的红色指甲油的手指头指着林天的脸,说道:“从昨天金色商场你得罪我之后,我一定要整死你这个小白脸。”
说到这,芳丽晴更是愤怒不已,直到现在想起来昨天在商场里裙子当众脱落的事,心中就阵阵难受。
开始她还想不明白,为什么好端端的裙子,质量也没问题,就会那么突然从腰间脱落?
裙子的质量她是知道的,名牌货,价格不菲,穿了几次都没有出现这种情况。
唯独在这个混蛋小白脸靠近之后,裙子就无缘无故的脱落下来,事后她越想越不对劲儿,最后把责任都归结到林天身上,一定是他搞的鬼。
“昨天在金色商场怎么了?”林天一脸茫然的问道,那无辜的表情,让芳丽晴看到了恨不得上去扇两巴掌,装得太像了。
“你就装吧。”芳丽晴气得浑身哆嗦,要不是手中的提包是个“LV”的名牌包,怕是要直接甩到林天身上了。
“我都不明白怎么回事儿怎么就装了?没你这么冤枉人的吧?”林天仍然壮着一脸无辜的模样说道。
“好,很好,非常好,你就装吧,只要你在燕大,看我回头怎么收拾你。”芳丽晴气得冷笑连连,决定不当着这么多人的面再和林天这无耻的家伙耍嘴皮子,省下被学校的人知道金色商场发生的事情,回头有时间找人整治一番林天。
看着芳丽晴气急败坏的离开,林天嘴角勾起一抹邪笑,在她身后大声的喊道:“你刚刚说的是在金色商场裙子当众脱落的事情吧?那件事真心不是我做的,不过你放心,看在你说我小白脸的份上,我一定不会把这事儿传出去的。”
芳丽晴一个踉跄,高跟鞋一歪,直接蹲坐在地上。
“该死的混蛋,我一定要整死你。”芳丽晴咬牙切齿的说道,红色的指甲紧扣手掌。
“我们走吧。”陈墨香见林天戏演完了,吩咐道。
林天看着陈墨香的脸,笑着问道:“你同情她吗?”
“她只是个可怜的女人,为了钱,她迷失了自己。”陈墨香承认的说道。
“听说过一句话吗?”
“什么话?”
“可怜之人,必有可恨之处,钱谁都喜欢,可是每个人赚钱的方法不同,道路不同,就看你怎么选择?既然她选择了她的道路,就不必去可怜,就算你可怜也没用,因为她只沉浸在享受物质生活中,无法自拔。”林天耸耸肩膀说道。
人人平等这句话只是嘴上说的,换做现实中,因为人的道路和思想不同,根本没有平等一说,享受的权利,赚取的金钱,付出的劳动,这些方方面面,都不断刺激着每一个人脆弱的内心,可这就是生活,选择了,跪着也要走下去,乞求别人可怜,不如自己好好加油。
社会就是一场游戏,怎么玩是你的事,玩不起,只能成为失败者。
陈墨香点了点头,像是明白了林天话里的意思,慢慢的在前面走着,带着他欣赏着燕京大学充满朝气的校园里。
无数的学生对着两人的背影指指点点,其中夹杂着小声的议论,有的声音太大还会传进他们的耳朵里。
“天啊,那不是咱们燕大的校花吗?怎么身后跟着一个男人,我是不是还没有睡醒?”
“见鬼了,咱们燕大的校花有男朋友了,看来今天有无数人要心碎一地了。”
“那男人是谁啊?好像不是咱们学校的?”
据不完全统计,林天出现在燕京大学的第一天,燕京大学的烟酒,卫生纸销量成倍增长,当晚整个学校弥散着酒精的味道…
对于这一群小屁孩大惊小怪的样子,林天懒得理会,径直跟在陈墨香身后。
穿过了小花园,走过一条石板路,绕过一个篮球场,穿过食堂,陈墨香带着林天来到一幢装裱精美的教学楼前。
大楼门口挂着黑色的牌匾,上面龙飞凤舞的刻制几个字:“燕大大学金融管理部。
两人直上五楼,陈墨香指着走廊尽头的一个房间,说道:“那儿就是我们上课的教室,你先进去在后面找个位置,我去个洗手间。”
“好的,我先过去了。”林天径直走向教室。
进了教室,因为还没有到上课时间,并没有想象中的那么安静,相反非常热闹,三五成群的男生聚在一起玩笑,还有几名靓丽的女生聚在一起说着悄悄话,林天看到偌大的教室,后面的角落没有人,就自顾自的走过去,坐在那,这时看到旁边的哥们一双眼睛正仔细的盯着手机屏幕,不时的莫名其妙的怪笑两声…
“喂,哥们,你在看什么?这么高兴。”林天拍着那哥们说道。
“我在看小说。”那哥们头也没抬的说道,显然全部的注意力都在小说身上。
“什么小说,这么有意思?”林天闲得无聊,就找他聊起来了。
“极品美腿军团啊,这书太有意思了,真不知道这个作者是不是脑子有坑啊,竟然写出来这么好看的小说。”
“咦,书名怎么听着这么吸引人呢?”林天点点头认同道。
“哎,别提了现在的作者都是书名叫的很,里面的内容却一塌糊涂。”这哥们一脸鄙夷的说道。
就在林天和这个小说迷对话的时候,一个披肩长发的女人坐在了他旁边,乌黑的长发柔顺的披散在肩膀上,脸颊清秀可人,眼珠又黑又亮,脸蛋漂亮极了,像是一个瓷娃娃一样美丽无瑕。
肤色白净,身材窈窕,短裤下一双没穿丝袜的长腿毫无遮掩的暴露在林天眼前,一时间看的竟然有些呆滞了。
这个女人和陈墨香的姿色相比不相上下,隐隐约约还有超过陈墨香的趋势,如此姿色的女人刚刚坐在林天身旁,教室中就突然安静下来,过了半响,粗重的呼吸声陡然加剧。
“难道是自己太帅了,这位美女主动送上门来?”一时间,林天脑海中出现了各种层出不穷的龌龊想法。
雪颜耳朵上塞着耳机,发帘遮掩住半边脸,正一脸陶醉的听着音乐,见到身旁这个陌生的男人正一脸陶醉的盯着自己,忍不住就把耳机摘下,问道:“你别瞎想,因为角落里安静我才坐在这里。”
“看来是我多想了。”林天闻言,苦笑了一下。
看到林天坦白承认,这个女人也忍不住笑了起来,嘴角勾起弯弯的弧度说道:“你好,我叫雪颜,白雪的雪,颜色的颜。”
“雪颜?怎么这么奇怪的名字?”林天问道。
“切,这你就不懂了,这样的名字才叫个性,不俗套不大众化,让人第一次听到就记忆深刻,像什么林天,李明啊这些名字太老土了…”雪颜翻白眼说道,对林天说她的名字奇怪表示不满。
“对了,你叫什么名字?”
林天愣了半响之后,方才缓缓张开嘴不情愿的说道:“林天。”
雪颜闻言,脸色一变,尴尬异常,这也太凑巧了吧,不过身为女人在转移话题方面具有天生的优势,对着林天微微一笑,再度说道:“我以前在金融系没见过你,你经常旷课?”
“我不是这个学校的学生。”林天倒也不隐瞒,说道。
“那你是来陪读的?”雪颜一愣,眼神转了转,说道,在燕大虽然一个教室容纳很多人,但是其中五分之一的人根本不是本校学生,都是来陪男朋友或者女朋友的。
“嗯。”
“可是陪读怎么就你一个人?”
“那不是来了吗?”林天眼神一挑,雪雁顺着他的目光看去。
只见陈墨香像女王一样缓缓走来,吵杂的教室从她刚刚进来就变得安静下来,不管男人女人的目光都纷纷注视在她身上,目光中包含了太多的复杂情绪:嫉妒,羡慕,贪婪,邪念…
“你来陪她上学的?”雪颜带着少许震惊一脸惊讶的问道。
“是啊!”
原本雪颜不信,可是当陈墨香坐在林天身旁的时候,原本紧抿的红唇不自觉的张开,半天没有言语。
“喂,你是不是傻了?”林天用手掌在雪颜瞪着美丽大眼睛前晃了晃,试图将她的三魂七魄召唤回来。
“你死定了。”雪颜一脸怨恨的盯着林天说道。
“我死定了?”林天匪夷所思的用手指着自己反问道。
“准备承受我和燕大单身男生的怒火吧。”
林天一呆,目光下意识的扫过宽敞的教室,只见所有男生的目光都集中在自己身上,目光中透漏着一股杀气,看来红颜祸水这句话古话一点不假啊。
可是,为什么也要承受眼前这个女人的怒火?难道她是?
为保证推荐结果的新颖性,本文提出了一种新的策略,通过在推荐流程中的精排阶段引入交互特征(指用户、书籍间的曝光、点击交互数据),在保证不降低推荐精度,甚至略有提升的同时,降低过滤的复杂度,其中总存储由400GB降低为200GB(降低的曝光打压存储,新增的交互特征存储),提升推荐引擎性能, 同时模型更容易维护。
曝光打压、过滤、新颖性、精排
个性化的推荐算法被广泛应用于互联网产品中,通过从大量的信息中有效地过滤掉用户不关心的内容,生成个性化的推荐列表。从用户角度来说,提高了单位时间的信息价值,减少了噪声的干扰,得到了更好的信息体验;从应用角度来说,可以精准地定位到不同的用户,提高了单位成本下的推广效果,减少了用户流失的可能性。
七猫推荐系统在对用户进行书籍推荐时,总共会经历5个阶段:
召回:根据用户喜好,从书籍库筛选几千本书籍。过滤:根据业务规则,过滤掉一些书籍。粗排:根据特定算法逻辑,将书籍候选集【千本级别】,快速排序,取topN,剩余200~300本。精排:根据深度学习算法模型,将粗排候选集,进行精排。重排:根据业务需要,对精排后的某些书籍,进行加权或降权。推荐系统面临着一个问题:
推荐位有限。如果每次推荐结果都相同,新颖性不够,影响用户体验;同时,书的分发效率也有一定影响。如何在保证推荐精度不下降的同时,提升新颖性;同时,整个系统又不能太复杂。在早期推荐系统刚上线的时候,过滤阶段还没有曝光打压策略,当时终章页推荐场景,随着时间的推移,有效点击率会呈现缓慢的下降。经过排查之后,我们发现,推荐系统会反复推荐给用户一些书,哪怕这些书前几天已经被推荐过了。此时我们意识到,系统缺少了一个机制,需要对用户推荐过的书籍进行一定程度的打压,由此诞生了曝光打压策略。
七猫推荐系统过滤阶段由多个过滤策略组成,本文重点介绍其中的曝光打压策略优化前和优化后的对比。
曝光打压策略
策略目的:七猫小说app在对某个用户进行内容推荐时,用户已经曝光过或点击过的书籍,需要进行一定程度的打压,以避免重复推荐相同的书籍给用户,提高用户推荐书籍的新颖度。策略逻辑:近30天内,用户在某个场景下,曝光过和点击过的书籍,需要进行不同力度的打压过滤,且点击过的书籍打压力度>只曝光不点击的书籍打压力度。【由此,引入了曝光打压权重和点击打压权重系数来控制】由于逻辑较为复杂,这里不过多阐述,简单总结一下曝光打压策略的整体思路:
以曝光打压为例,通过权重系数的设置,使得用户第1天曝光过的书籍,第2天不可以曝光,第3天可以曝光;若第3天此书籍又曝光了,则第4,第5,乃至第6天不可以曝光,第7天又可以曝光...
诸如逻辑,它变成一个阶梯式的打压,曝光次数越多,打压越狠。点击的打压逻辑类似,只是力度比曝光更大。
要想实现这个策略,需要完成两个方面:
将用户近30天内,每一天曝光和点击过的书籍进行存储,且需要实时统计。设置合理的打压力度,即打压权重,使得用户曝光或点击过的书籍不至于打压过轻或过重,保持在一个合理值。对于第一个方面,由大数据flink任务实时计算后存储在redis中,且需要比较多的redis存储.对于第二个方面,打压权重的设置,较难把控,为了得到一个合理的值,由此我们设置了多组参数,通过AB实验,来进行效果验证。如图所示:
上图,是我们在七猫书城信息流场景的14天实验情况,由实验结果,我们选出了一组较为合理的权重。
虽然,我们能通过实验来筛选出一组曝光与点击的打压权重,但是这里面依然有一些不足,如下:
实验成本较高,且不同场景的打压权重需要独立的实验来验证,即打压力度无法全场景适用,需要定制化设置。打压权重的设置,存在盲区,因为无法穷举权重进行实验,所以只能找出实验中的相对合理值。由于整个曝光打压策略,是基于人工的权重设置来控制,存在一定的缺陷。那么我们就会想到,能否让算法模型自行学习这个规则,然后进行打压降权呢?
而这个想法的可行性,是基于这么一个底层逻辑:
用户重复曝光或点击过的书籍,他的兴趣度是会下降的,即点击概率变低了。而对于算法模型来说,本身就是预测书籍点击率的,那么理论来说,精排模型对此类书籍应该会排的比较靠后,即被打压降权了。
那么要想实现这么一个目的,在精排阶段,我们就需要告诉算法模型用户和书籍的交互特征,即待精排的200~300本书籍,用户近30天内,分别曝光和点击过多少次,让其自行打压。
要想让模型能够自主打压,首先需要让其从海量样本中学习到这个经验,即规律。
我们选了详情页场景的精排阶段算法模型,在此基础上,添加了6个特征进行模型的训练:
特征名称
特征说明
userbook_show_count_30
用户该书30内书籍曝光次数
userbook_show_count_14
用户该书14内书籍曝光次数
userbook_show_count_7
用户该书7内书籍曝光次数
userbook_click_count_30
用户该书30内书籍点击次数
userbook_click_count_14
用户该书14内书籍点击次数
userbook_click_count_7
用户该书7内书籍点击次数
由于要对曝光打压策略进行可行性验证,在模型训练后,我们选取了 30,14,7日 的书籍曝光次数这三个特征来验证。
以某个用户的某次访问详情页请求为例,我们选取了3本书,初始曝光次数均为1,经过精排模型打分后,结果分别为:
书名
精排分数
天降七个神仙姐姐
0.16410595271736383
极品美女军团
0.1607327749952674
我的七个妹妹国色天香
0.15821188711561263
当3本书的书籍曝光特征即userbook_show_count_30、userbook_show_count_14、 userbook_show_count_7 曝光次数分别+1之后:
书名
精排分数
天降七个神仙姐姐
0.16226203786209226
极品美女军团
0.16175024607218802
我的七个妹妹国色天香
0.15163698163814843
曝光次数 +2之后,结果如下:
书名
精排分数
天降七个神仙姐姐
0.1554027097299695
极品美女军团
0.1541137108579278
我的七个妹妹国色天香
0.14864090736955404
曝光次数 +3之后,结果如下:
书名
精排分数
极品美女军团
0.1526818098500371
天降七个神仙姐姐
0.15063489973545074
我的七个妹妹国色天香
0.1470978984143585
如图所示:
通过以上的验证,可以发现,除了当曝光次数为2时,即曝光次数+1,极品美女军团这本书的分数有所上升之外,其余的情况,当书籍曝光数加的越多,分数下降的就越厉害,即被打压的越狠了。
该方案从整体数据表现上看,曝光次数越多,分数就越低,达到了预期目的。但对于类似《极品美女军团》这本书曝光+1后,分数反而变高的少量特殊情况,我们还在持续探索其更深层次的原因。
由于添加的6个用户书籍交互特征是离线T+1更新的,若把现有的曝光打压策略全部剔除,则就会出现,用户当日内重复访问某一场景,推荐的结果就会不变。
故而,用户当日内推荐的书籍,还是要曝光打压过滤掉,第二天的时候,特征已经更新了,此时算法再推荐昨天曝光过的书籍时,自动会打压降权。
以下是在书城推荐榜进行的14天实验情况:
注1:正常曝光打压实验组指的是过滤阶段基于原人工30日内曝光打压策略。注2:仅当天曝光打压实验组指的是过滤阶段只有当天曝光和点击的书籍会被过滤掉。注3:仅3天曝光打压实验组指的是过滤阶段由原来的人工30日内曝光打压策略缩短至3天曝光打压策略。注4:以上3个实验组的精排模型为同一个算法模型,都添加了6个用户书籍交互特征,他们只是过滤阶段的曝光打压策略周期不一样。注5:本实验重点关注仅当天曝光打压实验组,其余实验组顺手做的。
本实验只要有效点击率p值不负向显著即可,从图中可以看到,仅当天曝光打压策略,甚至还略有提升。
推测可能原因:书城推荐榜的无效曝光较多,使得一些好书用户根本就没认真看,就被系统认为是曝光过了,从而被曝光打压规则过滤掉,如下图:
而采用【过滤阶段当天曝光打压 + 精排阶段的算法模型自学习打压】这种组合方式,当天被曝光过的书籍,第二天依然有可能再次被曝光。至于如何抉择,取决于算法模型,这也正是采用这种方式的好处之一,由算法模型自学习打压而得到的结果,比人工硬规则打压,盲区更少,效果更佳。
【过滤阶段当天曝光打压 + 精排阶段的算法模型自学习打压】 比 【过滤阶段基于人工规则的30日内曝光打压】方式相比,有以下优势:
降低人工权重配置带来的复杂度 ,减少盲区,且效果也能得到保证。曝光打压redis存储可减少,原先需要存储近30天内,每个用户每天曝光和点击过的书籍以及次数,redis内存使用400GB左右。现在理论只要存储当天的曝光和点击书籍即可,当然精排模型新引入的6个特征也需要额外的的存储开销,约200GB,总体来说redis使用量降低约一半。推荐引擎的性能也能够得到一定的提升,原先在过滤阶段,引擎需要将用户30天内的每一天书籍曝光和点击数据进行查询、计算和过滤,性能消耗大;而现在只要查询当日的数据,进行过滤即可,响应更快。结论:
算法智能曝光打压的优化方案,在保证精度不降低,甚至略有提升的同时,降低了曝光打压策略的复杂度,已经经过AB测试,并应用到七猫app各个推荐场景。思考:
运营规则和算法结合的好处。运营规则可解释性强、但维护困难,且容易存在盲区;算法解释性差,但自动学习,更智能化,两者结合,才是上策。如何将这种以算法为主,运营为辅的组合方式运用在更多的方面,减少人工业务规则的使用,是后面需要进一步思考的。后续可能的探索方向:
探索实时特征对交互特征的影响,看是否能进一步降低过滤复杂度。探索更多的交互行为, 提升精度。在曝光打压策略的迭代优化过程中,产品冯雨昕,推荐引擎魏小亮同样给出了很多宝贵的意见,这里特别感谢一下。
作者:林永平
出处:https://tech.qimao.com/zhi-neng-pu-guang-da-ya-ce-lue-de-tan-suo-yu-shi-jian/
相关问答
极品美女军团txt全集小说附件已上传到百度网盘,点击免费下载:内容预览:极品美女军团作者:万慕白第001章断肠情泪更新时间2012-10-2819:30:23字数:4613...
内容简介:一个大山里走出来的绝世高手,一块能预知未来的神秘玉佩……林逸是一名普通学生,不过,他还身负另外一个重任,那就是追校花!而且还是奉校花老爸之...
《爱情公寓之美女军团》作者:沈三爷小说简介在现实社会中失恋的司徒南穿越到了《爱情公寓》这个异次元世界里,从此与胡一菲,美嘉,唐悠悠,林宛瑜还有秦雨...
下面这些都是本人看过的领主建设网游小说,绝非复制。《帝国远征》《英雄无敌之极品领主》《英雄无敌之国战》《网游审判》《网游之帝国崛起中》《地下城...
召唤万岁《召唤万岁》是连载于起点中文网的一部异界大陆网络小说,作者霞飞双颊。主要讲述了宅男来到一个叫龙腾大陆,可以召唤神兽的故事。《召唤美女军团》...
亡...《英雄无敌之国战》《英雄无敌之领主荣耀》《英雄无敌Online》《网游之混迹在美女工作室》《英雄无敌之最强驯兽师》《网游之死亡阴影》《英雄无...
...西游记之最强帝王类别:玄幻魔法简介:小痞子封于修,穿越到西游记的世界里,成为女儿国第一位男性国王。面对千万美艳娇娘、熟女萝莉,且看他如何组建美...
《帝国远征》《网游之帝国崛起中》《地下城魔王养成日志》《网游三国之城市攻略》《网游之地下城主》《英雄无敌之极品领主》《英雄无敌之国战》《网游审判...
张三丰在异界异界修神异界法神异界之随机召唤异界机械公敌。召唤美女军团张三丰在异界异界修神异界法神异界之随机召唤异界机械公敌。召唤美女军团
少女契约之书推荐超好看召唤万岁有点小白文娘山108星少女推荐超好看召唤千军好看召唤美女军团推荐不错召唤全面战争召唤梦三国召唤之高手如云召唤之游戏异界...