互联网上的浪漫相遇

    2011年,世界最大的婚恋网站Match.com收购了在线约会网站OkCupid。OkCupid曾作过一系列的研究,探索什么样的个人资料是最成功的在线约会个人资料。在一篇题为“个人照片的4大神话”(The 4 Big Myths of Profile Pictures)的帖子中,OkCupid的研究员通过分析7 000多张个人照片,并基于每个用户收到的信息数量来确定哪些照片最有利于在线约会成功。当然,仅仅收到更多的约会信息并不一定是好事。质量往往比数量更重要。但是,在我们讨论这个话题之前,可以先看看研究结果。

    研究者们将照片分为三类:调情脸、微笑脸和严肃脸。调情脸指人“直接对着镜头调情”,跟微笑或只是看上去高兴的脸不一样。研究者发现女性在线交友资料照片中的眼神接触至关重要。长着一张调情脸的女性每月都比别人多收到一点信息,更会明显多于被归类为严肃的人。没有眼神接触,结果就会差一大截。先不考虑面部表情,整体来说,与镜头没有眼神接触(因而,和浏览者也就没有眼神接触)的人收到的信息会比有眼神接触的人少一些。

    与女性情况相反,男性在资料中使用不看镜头且比较严肃的照片时,最有可能成功约到女性。而男士使用看上去调情且不看镜头的照片的话,最难约到女性。研究者还发现,男士照相时穿着随意还是西装革履,并不会对与潜在伴侣的约会造成大的影响。

    其中研究者发现的最有趣的现象之一是:你是否在照片中露了脸并不会影响你收到信息量的多少。不管照片里看到的是穿戴潜水装备的人、在穿越沙漠的人,还是完全没露脸的人,这些照片和能看到脸的照片一样都会激发网站用户的关注。照片中脸部入镜的女性平均每月会收到8.69条信息,而未露脸的女性平均每月会收到8.66条。而使用脸部照片的男性每10次尝试中,会有5.91次约会成功,而未露脸的男士每10次尝试中,会有5.92次成功约到女性。

    那么研究者的结论是什么?照片可以说明一切。照片“激起浏览者的好奇心,很大程度上展示了主角是一个什么样的人(或想成为什么样的人)”。值得注意的是,研究者指出:“在没有看到一个人的全身照之前,我们不建议你与此人单独见面。”

    空标题文档 - 图1
    这一切都说明,大数据不仅仅是商业工具,只要有合适的数据源,它同样也可以向我们展示如何最好地展现自我以寻求到合适的另一半。当然,数据也告诉我们,你不能忽视选择正确照片的重要性。

    为什么网上找不到真爱

    当然,众所周知,人们在网上约会时会言过其实。OkCupid联合创始人克里斯蒂安·如德(Christian Rudder)在另一项研究中,对交友网站的大约151万在线用户的数据进行了观察。

    在《在线约会时网友撒的弥天大谎》一文中,如德指出,他发现在身高方面,“几乎所有的男性都喜欢给自己加上5厘米。”事实上,男性身高“越接近180厘米”,他们越会将自己的身高取整,填上180厘米,“以达到梦寐以求的标准身高。”女性“虽然没有向某个标准身高集中的趋势”,但也会夸大自己的身高。那么收入方面呢?宣称自己年薪10万或以上的人真的有赚那么多钱吗?如德发现,线上约会的人实际收入要比声称的收入少20%。随着年纪增长,就会更加夸大。40多岁和50多岁的人会夸大30%甚至更多。人们不仅会夸大收入,上传的也是很久之前的照片。如德研究发现“照片越吸引人,就越有可能年代久远”。

    那么,在线约会网站何以决定哪样的人与你匹配,并推荐给你呢?

    据《金融时报》刊登在网站FT.com上一篇名为《Match.com内部》(Inside Match.com)的文章称,已有180万付费用户的Match.com网站新推出了一系列代码名为Synapse的算法,以分析“各种因素,从而推荐可以适配的对象。”就我们所找寻的对象来说,我们所说和实际所想并不常一致。虽然算法考虑到了人们宣称的喜好类型,但是它也会将用户实际浏览的资料类型考虑进去。比如,用户说自己喜欢哪个特定年龄段的人,但也会在该年龄段之外寻找合适的对象的话,那么,算法就会将此纳入考虑,并且在将来显示搜索结果的时候会将该年龄段之外的人也包括进来。

    与推荐电影或书本不一样,推测喜好会更复杂,因为进行配对的算法必须将双方的喜好都考虑进来。“就算你喜欢‘教父’,‘教父’并不一定也会喜欢你。”Match.com的首席分析师阿马尔纳特·桑博尔(Amarnath Thombre)如是说道。

    虽然Match.com自1995年成立以来,收集了7 500万注册用户的数据,却依然没有相关数据显示哪些约会是成功的,而哪些约会又失败了,这个问题就是该类算法面临的挑战。无法弥补这一缺口是创建终极配对算法的重要缺失。这也就是为什么在人们取消订阅服务时,网站常常询问他们取消的原因:是因为对线上约会的经历感到失望,还是因为已经找到了对象?这些数据不仅有利于进行市场营销,理论上,它们照样可以用于预测算法的创建。

    遗失的数据,计算机乱点鸳鸯谱

    正是这些缺失的数据会导致计算机配对算法的失效。在所有的大数据分析与预测引擎中,这类算法只与工程师用以设计和输入的数据一般好。一旦关键数据丢失,预测算法就会失效。

    来自西北大学(Northwestern University)的伊莱· J.芬克尔(Eli J. Finkel)和加利福尼亚大学洛杉矶分校(UCLA)的本杰明· R ·卡尼(Benjamin R. Karney)在杂志《公共利益中的心理科学》(Psychological Science in Public Interest)以及《纽约时报》舆论篇中共同发表了一项研究,其中指出在线约会真正重要的是彼此单独会面时是如何互动的,而不是他们在网上说了什么。这两位教授表示:“诸如交流模式、问题解决定势、性和谐等因素才是预测一段关系成功与否的关键。”

    同时,他们还指出,“双方讨论并试图解决分歧的方式预示了将来双方的满意度,以及这段关系是否会终止。”然而,在在线约会网站这一背景下,要评估这类特征并不容易。而且,在线约会网站也不会考虑一段关系的环境因素,例如“失业、经济紧张、不孕不育或疾病”等众多压力。

    两位作者也指出,虽然在线约会网站会收集大量的信息,但是,当涉及要确定哪两人能成为合适的长期伴侣的时候,这些信息也只是管中窥豹。很多在线约会网站声称,它们是基于双方共同的兴趣爱好来进行配对的,但2008年的313项其他研究表明,“个性特征和态度的相似性并不会对既定关系的良好发展产生影响。”2010年,有人对23 000对已婚夫妇进行了调查研究,研究表明,一些主要的性格特征,如神经质、冲动和外向对婚姻满意度的贡献仅占0.5%,这也就意味着,其余99.5%都是其他因素。

    那么此项研究的结论又是什么呢?在线约会与其他约会方式相比并无好坏之分。虽然,交友网站采用的算法有助于良好的市场营销,但是最终,这些算法也只是帮助网站用户开始网上约会的一个工具而已,同时,也在人口密集的地区(如纽约)提供一个有潜在对象的小圈子。

    从大数据的角度来看,这些研究真正显现的是拥有完整数据的重要性。不管算法公式是试图推荐电影、告知销售人员下一个电话销售的对象,还是推荐潜在伴侣,其算法再好也必须立足于数据。如果没有足够的数据和修补漏洞的方法(通过了解算法的预测正确与否),就很难创建精准的算法。就像扔飞镖一样,如果你的目标不是靶心,就算你把所有飞镖都扔在同一个地方也没有意义。

    爱情实验室的预言

    谈及预测,有一个科学家可以非常精准地预测哪两个人配对容易成功。心理学教授约翰·戈特曼博士(Dr. John Gottman)因其在华盛顿大学运行一个心理实验室而闻名,该实验室被称为“爱情实验室”。戈特曼在14年间研究了650多对恋人。基于他所做的研究,戈特曼在与一对新婚夫妇谈话半个小时后,就能预测他们的婚姻是否会长久,其精确度高达90%。

    戈特曼将他所称的“心理地图制作”(mental map-making)视为浪漫爱情的基础。在感情关系中,它就是寻找伴侣的过程。戈特曼举了一个关于“心理地图制作”的简单例子,例如男性对妻子在特定某天要做的事情所抱持的兴趣的过程。一个积极的心理地图制作者不仅要收集信息,还要对一天中收集到的信息进行思索,随后继续跟进。这也就意味着要询问配偶的约会情况、午餐内容,或是吃早饭时夫妻一起讨论过的事情。这看上去似乎很明显了——收集数据、思索数据和跟进数据的过程不仅有利于计算机计算,也有利于维持健康的关系。

    戈特曼和同事詹姆斯·穆雷教授(Professor James Murray)通过进一步研究并开发了生物研究的数学模型。他们创建了人体行为的数学模型,来分析预测婚姻的成功性。两位教授甚至和另外几个人一起出版了一本名为《婚姻数学:动态非线性模型》(The Mathematics of Marriage: Dynamic Nonlinear Models)的书。戈特曼和其他几位作者都认为:“婚姻的发展可以由微分方程式来支配,至少可以用它进行描述。”戈特曼和其同事能够使用数学演算来形容一段婚姻,并且模拟、推导夫妻在各种情况下的反应。

    戈特曼的研究发现,4大负面行为通常会导致离婚:对伴侣性格的批评、轻视、太过自我保护以及从互动的情感中撤出。戈特曼尤其认为轻视是“毁灭爱的硫酸”。将夫妻关于各种问题的回答进行的评估、身体语言的分析、生理数据的分析和数学模型相结合,戈特曼就可以预测一段婚姻是否会成功,也可以迅速就偏离成功轨道的婚姻提供建议。

    鉴于这些关于数学公式和微方程式的讨论,戈特曼看似将浪漫爱情变得不再神奇、浪漫,但也正如他本人所说的,科学家和研究者们拥有一个衡量人类关系的客观模型很有必要。

    在一个视频采访中,戈特曼透露了其他一些有趣的数据点。没有子女的夫妻在婚姻的前7年中离婚率高达50%,而有子女的夫妻离婚率仅为25%。但是,75%的没离婚夫妻也遭运了婚姻幸福感下滑。换言之,随着时间的推移,他们对自己的婚姻越来越不满。不过,这些看似令人沮丧的消息里还蕴藏着一线希望。戈特曼对那些依然在婚姻生活中感受到幸福的25%的夫妻进行了研究,以了解是什么让他们的婚姻一直幸福。他的结论就是:专注于相互了解、相互欣赏和相互钦慕的夫妻更有可能成为这25%,而不是另外75%。要成为这25%中的一对,尤其需要夫妻以积极的情绪对待感情,其积极情绪是消极情绪的5倍。

    婚姻可以挽救吗?许多夫妻在进行婚姻咨询两年之后又故态复萌,有了以前的老毛病。然而,戈特曼基于两项研究总结出两大要素,可以对婚姻产生长久地积极影响:第一,减少冲突解决中的消极因素;第二,通过专心帮助婚姻伴侣“变成更好的朋友”来增加整体的积极性。

    Facebook,在线人际关系网络

    戈特曼和同事们基于其多年的研究,在线下为夫妻提供帮助,而在网络世界中,也许没有哪个线上公司对人际关系的影响力能超过社交网站巨头Facebook了。Facebook如今已经在全球范围内拥有10亿多用户,是大家选择分享照片、更新状态、记录自己与他人生活时间轴的地方。

    像Facebook这样的社交网站所呈现出来的关系就是所谓的社交图谱。与一对一关系的单一连接线不同,一个社交图谱由许多互相交错的关系组成。如果乔伊认识弗雷德,而弗雷德认识莎拉,那么,在社交图谱背景下,乔伊和莎拉之间就通过弗雷德有了联系。而这些联系会因为涵盖兴趣爱好、地域、公司、品牌、生日、状态更新以及其他非人为因素而不断延伸、扩展。在社交图谱中,人们不仅与其他人有联系,也和活动、事件、公司以及产品有联系。

    六度空间理论普及了这一概念——世界上的任何两个人就社交联系而言,最多只隔着六步,即六个人。商务社交网站LinkedIn充分利用了这一概念,向商界人士展示他们是如何通过中间人与别人相联系的。于是,在这些专业人士想与自己并不直接认识,但是是朋友的朋友,或者同事的同事相联系时,就可以利用这种关联。

    在Facebook上,人们之间的联系可能比六度空间理论所暗涵的联系更加紧密。公司的一位工程经理圣吉夫·库马尔(Sanjeev Kumar)指出,Facebook的用户之间联系非常紧密,任何两个用户间平均只隔着4.74个人。社交图谱中的关系因为地域、爱好和其他因素的联系而更加紧密。

    社交图谱代表着大量关联人之间的关系,它可以回答很多有趣的大数据问题。其中包括数据分析师以及数百万用户有意无意间提出的问题,比如:我应当和谁联系?我应当去关注哪些照片?对我来说哪些信息更重要?虽然大多数用户都不会觉得自己在向大数据(也就是社交图谱)提出疑问,但是,这正是他们在做的事情,或者至少是社会性网络服务代表他们在做的事情。

    从技术角度来看,大数据中的社交图谱也同样有趣。回答上述问题要消耗大量的计算资源。每一个问题都涉及对整体社交图谱(术语叫作工作集)中的很大一个子集进行处理,也对每一个用户具有高度针对性。还有,社交图谱呈现了大量的实际数据,不仅仅是图表自身体现出的相互联系,还有照片、视频、状态更新、生日以及其他用户的相关信息。一个问题必须反馈正确的关系圈,也必须反馈与这些关系相关的数据,并且这种反馈基本上要是即时的。

    社交图谱呈现了这么多数据信息,为了跟进,Facebook必须开发定制服务器、创建自己的数据中心、设计特殊软件以查询图形、并有效地存储和检索相关数据。那么,这一切对于我们的人际关系而言,意味着什么呢?

    关系是一种社会资本

    作为我们在Facebook上进行自我表达的多种方法中的一种,“感情状态是唯一直接涉及他人的方式”。我们通常会在社交网站上宣布这些感情状态——订婚、结婚、分手和离异。

    2010年,大约60%的Facebook用户都在个人资料中设置了感情状态。同年12月,男女用户设置感情状态的比例为1.10∶1.28,设置了状态的女士人数多于男士。2011年,1/3的离婚申请都提到了Facebook,相比2010年的20%有所增长。在线公布我们的感情状态会加深研究者们所说的“感觉规则提醒”(feeling rule reminders)。这些规则就是一些社会规范——告诉我们何时该有何种感觉,以及我们的情感该有多强烈。通过线上公布我们的感情状态,我们会深化、加强这些规则。

    像Facebook这样的社交网站也会影响到人的健康和性格。有的人会在网站上真实地呈现自我,而有的人则会因为缺乏安全感而呈现一个美化了的自我。根据来自社交数据网站The Social Skinny的卡拉·普林格(Cara Pring)列举的相关数据,大约24%的美国人和28%的英国人都承认在社交网站上撒谎,或夸大自己的所见、所闻、所做。而且,太频繁地查看自己的个人资料也会导致自我意识过重,并产生压力和焦虑。

    同时,拥有比别人更多的网友可能会让我们感觉自己得到了额外的社交支持,从而增强我们的自信——Facebook用户的社交网络平均包含229个朋友,约有25%的人相信社会关系网增强了他们的自信心。朋友比别人少可能会让我们觉得害羞,但是网上朋友圈越小也会令互动更加真实。

    倘若对在线社交对我们的生活有重大影响存在质疑的话,有一个数据可以证明:40%的人更多时候是在网上交流而不是进行面对面的交流。互联网用户有22.5%的在线时间是花费在网络社交活动上的,而超过半数的Facebook用户每天都会登录网站。

    守护大数据时代的浪漫爱情

    我们看重网络中的身份以及这一身份带来的各种关系,不仅是因为这是一种展示自我的方式,也因为我们将它和社会资本联系了起来。社会资本包括线上资本和线下资本,它是指我们在社交网络中所处的位置,以及其中与之相关的联系和资源所带来的利益。

    据卡内基梅隆大学人机交互研究所(Human-Computer Interaction Institute at Carnegie Mellon University)以及Facebook的研究员称,这种资本分为两种:纽带(bonding)和连接(bridging)。纽带是指与家庭成员、亲密朋友之间的关系所催生的社会资本,而连接是指熟人所带来的社会资本。纽带关系和连接关系都有其价值,但通常是纽带关系能提供情感支持和陪伴,而连接关系主要是由更松散和多样化的关系组成,通常能够带来新的交流和机遇,比方说招聘信息——因为很亲近的人难有新信息提供。

    研究员将社交活动分为三大类:

    • 直接通过聊天或是邮件与朋友单独交流;
    • 通过查看他人更新的动态,被动地了解社会新闻;
    • 听广播,其中广播内容由不针对任何个人的最新动态组成。

    研究员认为,直接交流很有可能会增强这两种资本,因为聊天内容会很丰富,且两人的关系会进一步深化。一对一交流的时候,给予和接收信息都会深化双方情感。而且,因为广播交流所需的努力,简单的一对一交流显示了关系的重要性。对于连接社会资本,只有一对一交流才能为Facebook上的信息发布者增加社会资本,而其他交流形式只会增加信息接收者的社会资本。正如研究者所说,非定向广播和消极了解新闻及动态也许能增长信息接收者的知识,但并不会促进人际关系的发展。

    广播交流作为了解别人的信息源非常有用。我们可以通过聊双方都感兴趣的东西来加深关系或者结交新朋友。因为泛泛之交并不会太关注我们,但他们也许会听广播来了解新闻。收听广播信息对社交能力比较差的人更有益。

    研究人员还发现,只有少数几个生活变化才会对连接关系的社会资本产生重大影响。比如说,搬家就会对其产生积极的影响,可能是因为会增加新的人际关系,而且会让我们获得的信息和资源变得多样化。而失业就会对其产生负面的影响,因为失去了与以前的同事相关的社交背景。我们个人关系的变化对广泛的社交网络会产生什么影响呢?我们担心生活变化会给社交网络带来影响,包括结婚、离婚、死亡、生子、新工作、患病等,但实际上,虽然这会对我们的个人生活产生巨大的影响,但这对我们广阔的社交网络来说影响相对较小。

    将它和通过Facebook实现的社会资本的增减进行对比,情况又如何呢?每次将网上一对一交流的数量翻个倍,就会对连接关系的社会资本造成如同迁到一个新城市一样的影响,这相当于失业带来的影响的一半。换言之,一条一对一的数字信息,要是建立起了新联系,就能对连接关系起到如同迁入一个新城市一般的影响。言下之意就是,如果我们选择利用在线的一对一交流,社交网络会极大地减少我们在拓展自己的交际圈时出现的摩擦。这也许就可以解释求职时,为什么在专业商务社交网LinkedIn上发送一对一信息会非常有效,即使双方并不熟识,彼此是通过他人才联系上的。

    虽然交流在关系发展中扮演了很重要的角色,但是信息也同样重要。虽然不知道为什么这一点没那么明显,但是谷歌确实也影响着我们的人际关系。询问任何一个有过在线约会经历的人,他们都会说他们曾在谷歌上搜索过约会对象的信息。根据一项叫作“It's Just Lunch”的约会服务显示,43%的单身人士都在约会前上网搜索过他们的约会对象,而被调查的1 167名单身人士中,88%的人表示,如果约会对象在谷歌上搜索自己,自己不会有被冒犯的感觉。

    事实上,将任何一个人的名字输入到搜索引擎中,都会出来一系列与之相关的搜索结果——从提供背景信息的网站到提到过他或关于他的文章,再到他在LinkedIn上注册的资料。Facebook、Twitter还有其他形式的数字社交都比较新颖,这也就意味着,关于这类媒介的影响的学术研究相对有限。然而,很显然,个人的网上身份是大数据大量融合的表现。涉及我们自己的时候,大数据就是我们以照片、视频、状态更新、微博和论坛帖子的形式与人分享的自我以及我们的人际关系,更不用提我们在点击网站和网上购物时留下的数字痕迹了。

    大数据和浪漫情感:未来会如何

    数字社交的增强剂,如虚拟礼物,似乎不是人们用来表现浪漫的方式,但是这样的表达方式已经越发普遍。不管是在社交游戏中还是社交网络上,虚拟物品(比方说像真花一样,但是是以数字形式存在的虚拟花)越来越受到人们的欢迎。人们显然很乐意为这些数字商品买单。可以想象,在未来,推荐引擎可以精准预测什么礼物会最受欢迎,并为送礼者提供建议。当然,社交网络这样做的初衷可能是想确保双方不至于忘记彼此的纪念日。

    不管我们是否想要这些信息,关于我们自身还有我们的人际关系,大数据都在收集和提供更多的信息。虽然由Match.com网站研发的这类试图推荐更合适匹配人选的算法可能忽略了重要数据——关于人际关系是如何随时间推移而发展的,但是,我们可以预见,与Facebook或者其他平台相结合将可以提供更好的推荐和预测服务。

    总体说来,Facebook比其他网站更深入地了解人际关系的发展。名为“All Facebook”的博文从《Facebook效应》[9]这本书中援引了一段话:“通过仔细观察友谊和交流模式,Facebook的联合创始人及首席执行官扎克伯格可以提前一周确认用户会和谁谈恋爱,精准度达33%。”显然,扎克伯格可以利用这些数据——谁刚恢复单身、谁关注了谁的资料、谁加了谁好友等,来作出更好的预测。

    在线约会和社交已经越发获得社会认可,而其过程中也催生了大量数据。交流形式众多,却没有一种能替代一对一交流。不过,使得交流更简单易行的社交网络,能够大大减少建立新关系和维持现有人际关系所需的努力。现在,如Match.com研发的算法类型也许只是开启低摩擦交流的一种方式。

    随着越来越多的人使用苹果手机、配备安卓系统的手机等智能手机,我们看到很多约会应用软件涌现出来,成为人们结交新朋友的新方式。比如,不管他们是在当地的酒吧、运动场上,还是在旅途中的另一个城市,应用软件Skout都能帮助用户随时随地寻找新朋友。这款应用整合聊天、互换照片和送礼服务。手机应用将帮助我们与所关心的人保持联系,并持续减少交流障碍,同时生成大量有助于进一步优化交流和引入新联系的数据。

    也许大数据救不了一段出现了问题的关系,但是大数据能为我们提供视角,了解围绕在我们关系周边的外界环境,比如说一年中哪段时间我们的关系会最难熬——这是基于这段时间的分手量来决定的。大数据通过确认他或她是否比往常交流得少,来帮助我们确定一个友人或者亲人是否在走向苦痛——压力倍增或者经历了多次重大人生事件,例如离婚、失业、丧亲或者失去了一个亲密友人都可能会导致抑郁或者其他问题。同时,通过不断让交流变得简单,大数据能加深现有关系并支撑新关系的建立。

    虽然看似讽刺,但是确实是因为我们是社会性动物这一本质,导致我们渴望结交新朋友、巩固旧朋友,这也就是我们创建使交流更简单易行的科技的最大动力之一。我们也许不会把像Facebook和谷歌这样的网站与大数据应用联系起来,因为它们被包装成了易于使用、方便消费者的平台。而事实上,它们正是大数据的缩影。不管我们是在讨论在线配对或者预测婚姻幸福,是在谈及大数据的规模和成本经济,还是谈论数据流和存储分析数据的低成本,我们都很容易忽略大数据给我们日常生活带来的影响。数据不仅仅能为你寻找命中所爱开辟新途径,也许未来,它也能帮助你守护你所找到的这份爱情。