真相到底是什么?追解惊天影响幕后不为人所知的秘密。
着手写这篇文章时,首先遇到的难题是起个什么题目。推敲、纠结之后,最后决定用比较直白的“正解”,之所以用正解主要是觉得目前的“曲解”很多,很多关于斯诺登与棱镜计划的报道都带有片面性,这种片面导致的直接结果就是普通民众反而更搞不懂事件的真相,更重要的是这种曲解忽视了这一事件背后一项将影响到我们未来的重大科技发展,甚至从***事角度说,这个新发展的当量与潜能绝不亚于当年的原子弹。对了,这正是我想以正解的方式跟大家聊一下棱镜计划背后一个比谍战这等戏剧性更严谨、更专业的话题:大数据。
大数据可能是近年营销界最热的时髦名词(没有之一)。但国内外作者写的介绍大数据的文章与书籍,总体感觉多数不太着边际,有点像那个始终令人费解的IBM广告。公平地说,IBM应该是目前全球在大数据方面最领先的企业,之前在美国刚开始从业时的几位大数据方面顶级的同事后来主要去了两个地方:IBM和安然,后者已经因为Cook the Book(做假账)而倒闭,但这家几乎空壳的能源交易企业并非完全没有领先的业务能力,其实它的应用型数学建模能力是全球最顶尖的,通过分析美国各州的天气状况,安然能够预测未来的用电趋势,从而通过买入卖出电能,从中赢利。这可能是这家被定义为证券欺诈公司唯一扎实的商业模式。
不过,尽管大数据这个概念已经成为一种时髦,但大数据不等于一般我们熟悉的数据挖掘。迄今为止真正懂大数据应用的企业几乎是凤毛麟角,客观地说懂大数据应用的人本来就非常有限,这不是一般的数学天才,也不是一般的商业管理人才,大数据应用需要能将巨量数字转化为商业洞察力的通才,在国外因为这方面人才奇缺,因此也通常称之为绝才。当然这种“商-数”绝才还没有开始从事媒体工作,这也部分解释了为什么迄今为止对棱镜门的看点还是停留在“侵犯隐私”、“网络攻击”这等过时的观念上,而对其中最有技术含量的亮点“大数据”基本视而不见。
祸起临时工。今年6月受关注度最高的国际新闻无疑是美国国土安全局合约外包商员工爱德华·斯诺登对外界曝光了美国涉及多领域的大规模电子监控活动以及对其他国家的网络攻击,由斯诺登事件被忽然推向前台的美国棱镜计划(PRI***)也成了广大或担心的焦点。
民众担心什么?以斯诺登透露的消息加上绝大多数新闻记者的习惯性视角,棱镜计划被蒙上了一层高科技谍战的色彩,似乎美国正在网络世界展开新的电子战;而一般民众(包括美国民众)似乎感觉自己的一言一行都可能在美国的电子监控之下。而这在视个人隐私为基本人权一部分的美国是难以想象与难以下咽的,一般民众甚至感觉到自己背后那一双双联邦调查局(FBI)的眼睛
当然民众的这种恐惧也不是纯粹的毫无根据,在当今的信息高速道上,要发现与获取我们留下的很多电子痕迹、踪迹、轨迹并不是一件太难的事情。那么斯诺登曝光的这个棱镜计划究竟是个什么东东?它又是靠什么从如此巨大的信息量中找出有意义、有价值的信息或情报?
美国在监视什么?不妨先简单了解一下棱镜计划:棱镜计划是一项由美国国家安全局自2007年起开始实施的绝密电子监视计划。通过棱镜计划,美国联邦调查局和国家安全局能够对各大技术公司,包括微软、雅虎、谷歌、Facebook、PalTalk、YouTube、Skype、AOL、苹果的数据进行挖掘,有能力深度监视普通民众的电邮、即时消息、视频、照片、存储数据、语音聊天、文件传输、视频会议、登录时间和社交网络资料等细节。这听起来似乎十分恐怖,但真正了解一下棱镜计划是怎么以大数据为主要技术手段达成这等监“视”,或许你悬到半空的心可以稍稍放下一点。
大数据应用的首个大型实验——棱镜计划。出于反恐的需要,美国***府于2007年正式决定在安保上做一次大数据实验,这就是我们现在所了解的棱镜计划。简言其工作原理,那就是人工智能系统通过“关键词+发生规律”不断对产生的大量电子痕迹、踪迹、轨迹进行搜寻与分析。这里的“关键词”不仅是你网上键入的文字,也可以是声音或***像(将语音转化为文字并不难),我们已经熟悉的SIRI等应用都是这个原理。你的语音不仅可以通过电脑程序还原成文字,甚至带有你个人独特的用词规律与音频特征。棱镜计划的人工智能程序通过对大量实体与虚拟世界的电子痕迹、轨迹、踪迹进行分析,从中找出与一般人日常生活规律不符的可疑点,并对可疑点进一步深入跟踪,以此发现问题或者排除可疑。
举例来说,你的信用卡购买记录显示:购入大量化肥(一种可以与汽油混合构成剧烈爆炸物的重要组成成分),而你所住地区与你从事农业活动的特征并不相符,那么棱镜计划的人工智能程序就会进一步深入配对你的其它行为,假如你的汽油购买记录显示不太正常的增量(与以往的月消耗量不符),那你的安保危险级别就会进一步升高,从普通民众中脱颖而出;假如你的网络访问显示经常造访一些激进组织的网站,那么你的安保危险级别将进一步升高你也许会问:棱镜计划怎么会知道我买了什么?假如你在美国,它有能力知道,因为棱镜计划除了能获取网络(包括固网与移动互联网)上的信息,它也会从做零售扫描数据供应商那里购买数据。
值得一提的是:直到这一步,所有的分析都是人工智能程序完成的,你只是一个数据点,还没有真的人来监视你,FBI的探长要等到某个数据点的安保危险级别升高到一定程度时才会人工介入。绝大多数过着正常生活的人(数据点正常)都没有被FBI探长关注的荣幸,这也是美国可以用一个基于大数据应用的人工智能程序就可以确保“9.11”之后没有再次遭受重大灾难性恐怖袭击的原因。而我们都清楚“9.11”之后对美国敌视的群体有增无减,从这点上看这个大数据应用实验是相当成功的。