数据并不窥视人们,人们对人们间谍。但是,通常很简单的事实很难掌握。鉴于NSA丑闻,常规数据违规甚至在私人谈话中间谍电视的故事,公众对数据实践变得更加不信任并不令人惊讶。在美国人中,91%的人同意消费者对公司的收集和使用的个人信息的控制失去了控制,61%想要在线保护他们的数据。无论是通过社交媒体故意披露的数据,还是通过在网站和智能手机上通过数字足迹收集的数据,有着恐惧,隐私,信息自由,甚至民主都处于危险之中。
通过通过法院工作的所有诉讼以及在媒体中讨论的所有可怕可能性,很容易跳到结论,即大数据分析本质上是邪恶的。所以它吗?
比邪恶更好
我最近与一群国家立法者和高管会面,讨论他们如何通过使用大数据,更复杂的分析和更新的数据管理平台来帮助他们的状态更好地控制成本,限制欺诈和更有效地提供国家服务。提出了隐私问题和数据的滥用,导致了一些激烈的讨论。讨论的核心是,由于强者滥用和滥用的风险,讨论是否会收集大量数据是一个好主意。
我指出了鲁棒数据如何提供巨大益处的例子。考虑分配有虐待儿童历史的家庭的国家社会工作者。当与新案例工人没有与家庭的互动数据的数据时,儿童最终可能会有不必要的伤害甚至死亡。例如,在佐治亚州的家庭状态,对死亡的孩子有很多关注,因为案例工人没有关于儿童面临的已知风险的关键信息。
一个州官员指出,与这些州工人收集的高度敏感信息有关的有效关注。制作信息很容易获得意味着低薪,非技术工作人员将在其指尖高度私密,敏感的信息。这种信息可以滥用。但是,这些信息将保存儿童的案件远远超过滥用案件。如果获得数据的人知道误用的人将不仅将他们的工作放在行上,这将是尤其如此,但如果他们违反了他们所获得的信任(即一击,你出局,他们将被激动地起诉。 )。
这有点像驾驶。每次我们开车在一辆车里,我们都会冒着生命冒险。在任何时候,有人可以撞入我们,即使我们做错了什么也没有杀死我们。当发生这种情况时,这是悲惨的,但它很少发生,我们认为这是可接受的风险。我们获得的许多福利拥有能力和自由来移动超过弥补风险。没有人认真建议禁止从道路上禁止汽车,以阻止每年发生的大量避免的汽车死亡。作为一个社会,我们已经确定了与风险相比的福利太大了。
我们需要遵循具有大数据和分析的相同方法。使用大数据正确的好处可以是巨大的。然而,无论我们多么仔细,我们都会滥用相同的数据。我们的目标应该是最大限度地减少滥用的发生,并使处罚足以劝阻大多数人甚至尝试。如果州政府以及其他组织能够在只能杠杆的积极方式中利用大数据,我们都会更好。
Bill Franks是Teradata的首席分析官,他提供了对分析和大数据空间趋势的洞察力。他是本书的作者,驯服大数据潮汐,最近发表的第二本书,分析革命。他是积极的演讲者和国际分析研究所的教员。在www.bill-franks.com找到他。