身处如今的大数据时代,你真的知道如何处理数据和分析数据吗?或许那些被你忽视的数据背后就暗藏着重要的商业灵感。并非人人都是数据专家,有时候你需要一些专业的软件来帮你处理数据。那么如何能快速、准确地从数据中提取最有价值的部分从而进行有效的分析呢?只会简单统计图肯定是不够的,你还需要 Power BI 平台最新推出的“快速洞察”(Quick Insights)功能,利用可视化的数据呈现方法以及专家级的数据洞察能力,实现快速、专业的数据分析。
Power BI 是微软推出的在线服务,通过 powerbi.com 能够让你用最直观的方法对数据进行处理,例如查找和呈现数据、在线共享数据、团队协同合作,等等。目前,Power BI 平台最新推出的“快速洞察”(Quick Insights)功能够帮助你快速找到数据背后的秘密。想要使用这个新的工具,你只需选择“Quick Insights”,并将它应用在一个已经上传到 PowerBI 的数据集上,系统将会在大约几秒钟内从数据中搜索出你可能感兴趣的信息,如数据之间的相关性、数据内的异常点、时序数据的趋势以及周期性变化规律等等,并进行可视化呈现。当用户面对陌生的数据集不知从哪里入手进行分析时,这些自动搜索出的信息可以为用户提供有效的切入点。对于用户熟悉的数据集,Quick Insights 也有可能提供超出预期的分析结果。
更好的数据分析从 Quick Insights 开始!
BI 即商业智能(Business Intelligence, BI)。过去在商业智能领域,用户和数据分析工具之间的交互往往是单向的。具体表现为,用户用命令或者通过图形化界面告诉系统需要进行查询或者生成图表。这样系统只是被动地接受指令,对数据进行处理然后返回结果。相比之下,Quick Insights 提供了双向的交互模型。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以 insights 的形式进行组织和排序,并将排名在前的 insights 提供给用户。不仅如此,Quick Insights 会选择适合的数据展示方式来呈现这些 insights,并配合文字说明以方便用户理解。
目前,Quick Insights 提供了七种类型的 insights。借助这些不同种类的 insights,用户能够快速地在数据中找到关键信息。以汽车销售数据为例,倘若你上传了一份跨越多年的汽车销售记录数据,或者是一份汽车相关的应用软件下载记录数据,那么如何在如此庞杂的数据中筛选出最有价值的信息呢?Quick Insights 可以从以下方面提供帮助。
1、主因素分析:在特定维度下,分析找出对于结果影响最大的某个因素。例如汽车销售量的大部分是由一线销售贡献的。
2、类别优势或劣势分析:鉴别出单一维度下,相对优势或劣势突出的元素类型。例如,在消费者获取购车折扣的联系人中,一线销售和市场经理这两项,相比于其他项有明显的领先优势。
3、时间序列特殊点:对于时间序列数据,分析出具有异常数据的时间点。例如 2012 年 1 月到 7 月的某几天,消费者对于天气相关的应用软件的下载量异常的高。
4、时间序列的趋势:分析数据随时间变化趋势。如南美地区的折扣在逐年增加等等。
5、时间序列的周期性:分析数据的周期性变化趋势。如产品预算随时间呈现明显的周期性增长。
6、稳定的比例关系分析:找出一系列变量中有稳定比例关系的自变量与因变量。例如在汽车销售的成本核算上,一线销售所占比例基本不变。
7、数据关联分析:找出多个变量之间的相关性。例如折扣力度和销售量之间的正比例关系。
未来,Quick Insights 还将推出时序数据的变化分析以及均匀分布分析等更多的专业分析模型供用户使用。“Power BI 的新功能——Quick Insights,让你只通过点击鼠标,就能对数据使用多种分析算法并找到潜在规律,”Power BI 的项目主管 Patrick Baumgartner 解释说。
知其一,也知其二
Quick Insights 的诞生来源于两个团队的共同努力,分别是微软亚洲研究院的软件分析组(Software Analytics Group)和总部的 Power BI 产品团队。微软亚洲研究院软件分析组多年来在数据分析以及可视化等方面的研究和积累为 Quick Insights 的研发奠定了牢固的基础。
“微软亚洲研究院软件分析组的研究工作可以分为应用领域和基础研究领域,”该组的首席研究员张冬梅博士介绍道。从应用领域来说,软件分析组以软件为研究对象,主要采用数据驱动的方式解决三个方面的问题,一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等等;最后是软件开发效率(Productivity)。为了解决这些应用领域中的问题,我们需要在一些基础研究领域内有相应的技术支撑,包括大规模数据存储与计算、各种数据分析算法、以及信息可视化。
张冬梅博士说:“日常工作中,我们在基础研究领域中的技术会为应用领域的研究目标提供支持;同时,我们在应用领域中遇到的挑战也为我们在基础领域的研究提供问题和灵感。事实上包括‘Quick Insights’在内,我们有很多研究课题与项目设想是基于这种‘应用领域与基础领域’相互作用的工作状态。”
在张冬梅博士和她的团队内部, Quick Insights 有一个内部代号,即“IN4”项目。“IN4”的名称取自 interactive(互动)、intuitive(直观)、instant(瞬时)和 insights(洞察)这四个单词。这四个单词描述了 Quick Insights 的产品特性,更包含了微软亚洲研究院软件分析组对于这项技术的期待与追求。团队成员们希望“IN4”能让未来的数据分析过程更具互动性、更加直观、更实时快速,最后也更具智能化的洞察性。
成功的基石伴随着合作的共赢
2015 年 3 月在微软技术节(TechFest)上,“IN4”项目首次在公司内发布。就在这场微软技术节上,“IN4”项目和 Power BI 首次相遇,并一拍即合。随后的几个月中,两个跨国团队密切合作,攻克了许多技术难关,迅速开发出 Quick Insights 的原型,随后不断完善。Power BI 团队十分激动地在邮件中写道:“非常感谢微软亚洲研究院团队的支持。如果没有你们的技术,我们在智能数据分析方面的产品开发将会难以开展。正因为有了你们的帮助,我们才能如此迅速和高效地把这项让人惊喜的技术应用到 Power BI 中。”
今年 12 月,Quick Insights 正式上线。在短短不到 9 个月的时间里,我们见证了一项技术研究向产品的转化,时间之快,在众多技术转化的合作案例中也不常见。谈及为何能在这么短的时间内从合作想法的萌芽到产品功能的发布,冬梅博士感慨这离不开两个团队的共同努力:“虽然两个团队距离遥远,甚至都没有太多面对面交流的机会,但两个团队的合作非常默契。有了想法、技术再加之以践行,合作共赢,才最终让我们的灵感‘振翅高飞’!“相信在未来,两个团队将会继续携手并进,在 Power BI 的 平台上为用户带来更多更智能的数据分析服务!