云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

服务器_企业邮箱管理办法_是什么

小七 141 0

为什么Airbnb数据科学家要做实际的科学实验

《韦伯斯特词典》对信任的定义是:"信心;对他人诚实、诚实、公正、友谊或其他合理原则的依赖或休息",或者至少我是这么说的。有些因素会影响你判断你是否相信一些你甚至没有意识到的事情。你是怎么理解这个定义的?听起来准确吗?你相信这个网站吗?这位作者?这一切是否感觉像是某种奇怪的反向心理学的东西,旨在证明某种关于信任的观点?很快,你的大脑把所有这些因素都考虑进去了,然后你就做出了一个决定:要么相信这个定义,要么不相信。量化这些几乎是不可能的。它之所以"几乎"不可能,是因为像Airbnb数据科学总监Alok Gupta这样的人的工作。他和他的团队致力于把数字赋予模糊的概念,比如"信任"对于Airbnb这样的公司来说,信任对他们的业务是必不可少的。公司的存在基本上只是因为他们认为他们可以开发出一种产品,利用别人没有注意到的信任库。所以信任对他们来说是件大事。把这个重要但模糊的概念转变成可以量化的东西,用阿洛克奇妙的英语话说,是他职权范围的一部分。但即便是确定他们追求什么样的信任也很困难。"是点对点信任吗?是点对平台信任吗?它是托管信任的平台吗?什么是等级制度?"阿洛克问道我们可以用什么来衡量最重要的指标呢在剑桥和伦敦帝国理工学院学习数学,并在牛津大学获得统计金融博士学位的人,对情感领域采取定量研究的方法,通常会得到更多的定性研究,也许这并不奇怪。但对阿洛克来说,解决最少数量的问题是数据科学家能够发挥作用的最大领域。我们采访了阿洛克,他是如何定义"数据科学"的,即数据科学家可以产生最大影响的领域,以及他在与一组研究人员合作量化Airbnb平台上的信任时发现了什么。数据科学工作的三大核心虽然"数据科学家"这个名称是模糊和宽泛的,但阿洛克有一个框架,有助于理解那些往往属于这个保护伞下的东西。他认为数据科学工作有三种关键类型,每一种都需要不同的技能:分析、测量和优化。这些角色包括从整体上分析公司的绩效,到实际构建旨在提高公司绩效的软件产品。"分析是:‘作为一个企业,我们应该关注哪些汇总数据,以及我们应该看哪些数据才能知道我们是否运营良好?"阿洛克告诉我们。"这一类别一直存在于金融公司,有时科技公司所称的"数据科学家"与金融公司所称的"定量分析师"是"定量分析师"的缩写。"下一步,衡量,是关于准确观察分析师关心的指标,并知道是什么推动了它。这意味着开发假设并与团队合作构建测试它们的特性。弄清楚如何建立一个能证明因果关系的实验是一项艰巨的任务。"优化的不同之处在于,它是数据科学家真正构建产品的唯一领域。"一旦你有了良好的测量方法,人们就会希望我们通过数据构建的许多产品实现自动化;因此,第三类数据科学家构建了机器学习产品,其理念是自动优化现有功能并预测未来结果,"阿洛克说。这三种类型的数据科学家都扮演着重要的角色,但阿洛克认为其中一种可能是最具影响力的,因为它有能力获得事物的真相。测量两次,切割一次在这三个领域中,阿洛克坚持认为测量是数据科学家最有影响力的地方。对他来说,"测量"意味着设计实验,科学方法风格:观察、假设、实验、结论我认为这是最真实意义上的‘科学’,在这三个范畴中,"阿洛克说。任何好的实验的关键是一个值得检验的假设,但这还不够。下一步至关重要的是,能够产生可伪造结果的实验设计。""测量往往被忽视,往往是最有影响的,"阿洛克告诉我们在Airbnb的产品团队中,通常有六名工程师和一名数据科学家,也许还有一名设计师。数据科学家的角色是帮助产品经理在产品生命周期的开始就对机会大小和假设进行价值评估和优先排序。"因此,当斯坦福大学的研究人员带着一个有趣的实验想法来到Airbnb时,Alok看到了Airbnb潜在的有影响力的结果。这项研究计划"调查共享经济平台是否以及在多大程度上可以设计技术特性,以抵消可能导致社会偏见的自然行为倾向。"用通俗易懂的话来说,他们想看看人们对Airbnb上的评级有多信任。有大量的证据表明,从人口统计学的角度来看,人们更可能信任与自己相似的人。斯坦福大学的研究人员从他们最初的意愿来看,他们对服务的信任程度。对于Airbnb来说,这是他们建立业务的基础,因此他们相当自信,在某种程度上,这是真的。重要的是学位。量化信任在进行实验时,他们必须决定什么是信任。阿洛克说:"我们将信任归结为Airbnb的声誉体系:客人对主人的评价和主人对客人的评价。我们想了解评级系统对自然偏见的增量力量是什么,我们称之为同性恋,也就是说,基于肤浅的属性,与长得像你的人在一起感觉更安全,或者更安全,"在这个例子中,这意味着位置、年龄、性别和婚姻状况。实验的目的是测试人们对Airbnb评分系统的信任程度,以及之前的主人或客人留下的评价。Airbnb的审查和评级系统旨在帮助培养和促进信任。只有在预订完成后,主人和客人才会互相回顾,这意味着你看到的信息是真实的、有根据的。实验者通过将他们的近9000名参与者(都是真正的Airbnb用户)放入一个游戏中,在这个游戏中,他们被给予100个"学分",让他们在这四个属性(位置、年龄、性别和婚姻状况)上与他们有不同程度的差异。实验结束时,参与者获得的学分越多,他们获得现金奖励的可能性就越大。实验的受试者被告知,他们的学分在发放时将增加三倍,然后由接收者(即实验者设计的人造轮廓)在他们认为合适的情况下返还给他们。如果一个受试者给了一个档案10个学分,它将增加三倍到30个学分,平均分配奖励意味着20个学分会返还给受试者,因此100%的投资回报率。因此,参与者对某个配置文件的信心越强,他们就越应该在该配置文件中进行投资,以回报超出其原始投资的金额。这就是阿洛克的团队和研究人员如何代表信任。如果他们相信某个人能收回比他们给他们更多的信用,他们就会投资,而且他们对那个人的期望越高,他们就会投资越多。参与者被分成两组。第一组(世界1)确凿地表明,人们投资最多的是那些拥有全部四个记录属性的人,如果他们共享四个属性中的三个,则投资更少,如果他们共享两个属性,则更少,以此类推。这一行为与先前的同性恋研究一致。第二组(世界2)与第一组有相同的外形,但有一个关键的区别。对于在所有四个测量属性上都不同于参与者的个人资料,这些资料也具有较高的Airbnb评分和较高的好评率。这就是阿洛克和研究人员所关心的。他们预计,这将比一个在所有四个属性上都不相同且评级不高的配置文件做得更好。但是它会比共享一个属性的配置文件更好吗?两个属性?所有的属性?如果是,要多少钱?结果令人惊讶。高评级,但特点不同的制造型材获得的投资比其他任何公司都多。准确地说,这组人的档案特征各不相同,高评级和评论数量比同一实验组中与实验参与者具有相同特征的人多获得51.5%的投资。"我们没想到第五组的所有属性都不同,但评分很高,能够击败所有属性都一样的,没有评级,而且相差这么多。阿洛克说:"我认为这真是一个了不起的发现。图表显示了实验参与者在控制组和实验组用户身上的投资额更换打结器毕竟,这是有道理的。什么是同性恋,但一个明显错误的评级系统?有更好的替代品吗?实验的参与者似乎已经准备好相信某些东西,而不是自己的直觉。"这不仅意味着家庭共享,也超越了Airbnb,"阿洛克说。这是一个既令人不安又深受鼓舞的发现。"我们经常考虑如何让人们有机会以其他方式使用Airbnb社交货币,"阿洛克说找出如何以其他方式帮助人们做到这一点是一个非常好的机会,这绝对是我们将来可能会考虑的问题。"这是一个有趣的情况