搜索改变生活篇1
伴随搜索的不断演进,搜索引擎已经从当初的相关链接发展到现在的智能“框”。消费者、品牌广告主、传统企业统统汇聚在这个人口处,为搜索引擎营销提供了无限可能。谁掌握了这个入口,准就领会了品牌营销的要义。
捕获消费者
早在2006年,美国《时代周刊》就曾经将“年度风云人物”的头衔颁发给“YOU(你们)”信息时代的网民。因为正是“你们”的想法和概念,改变着信息年代。在这个信息爆炸的时代,聪明的广告主也将营销的核心聚焦在人(目标消费着)身上。
今天,当消费者在做出一项购买决定之前,通常会通过搜索获取产品的相关信息――功能,价格、质量、口碑、适合什么人群等等,这些信息影响着消费者的购买决策。正是搜索引擎的发展,带动了消费者行为的这种改变。
搜索引擎发展到今天,从人机界面来看基本没有改变,只是一个简单的搜索框。但是在这个框背后,却发生了日新月异的变化。而消费者行为的改变,决定着搜索技术、广告主投放、营销策略都将随之改变。
10年前谈到搜索的时候,消费者行为仅限于搜索一些新闻、文件资料等。如今,他们通过搜索获取品牌、产品、服务等等多方面的信息,这些信息与他们的工作和生活息息相关。随着数字化的进展越来越深入,搜索引擎能够起到的作用也将会越来越大。
伴随互联网应用的普及,消费者对搜索的需求变得越来越复杂。搜索需求已经由当初的一个或几个关键词的叠加变成具有一定含义的一句话,比如“我的电脑中毒了怎么办?”等等,这些需求对搜索技术提出了更高的要求。
此外,消费者的媒体习惯正在发生改变。目前,消费者每天在互联网上的时间逐渐超过电视、报纸、广播、杂志等其他媒体,把互联网当作生活的一部分。在日益扩大的网民中,搜索用户依旧保持着80%的高渗透率。
搜索已经成为网民生活中必不可少的一部分,而就在消费者进行搜索的那一刻,他就作为目标消费者被搜索引擎所捕获,当他站在搜索引擎这个人口处,人口背后呈现出一片营销新天地。
品牌营销之关键一环
通常,市场营销的目的是提升品牌或产品、服务的知名度、美誉度、忠诚度,以达成促进短期或长期销售的任务基于消费者行为改变。信息时代的广告主发展,搜索引擎是消费者进一步了解产品的重要手段,能够很好地帮助企业提升品牌。因此,搜索引擎营销理应成为企业在整合营销过程中的重要组成部分。线上的品牌形象,代表着更有活力、更有发展的人群,因此也就意味着他们在搜索营销方面需要更多的投入。
易观国际总裁于扬指出:“数字营销尤其是搜索引擎营销,是对传统营销方式最有力的补充。从我们的分析数据来看,为了在提升品牌方面取得事半功倍的效果,大品牌客户已经开始大规模投放搜索引擎营销,投放比例也正在不断增加。大品牌客户对搜索引擎的大幅投入将加速推动搜索引擎营销在中国的持续发展。”
由于搜索引擎能够直接捕获消费者,与之进行一对一的品牌信息传递,所以品牌广告主越来越重视搜索引擎营销,并且把搜索引擎作为企业在整合营销过程中的重要组成部分,与电视、纸媒、其他互联网等媒介形成相互补充、相辅相成的关系。
今天,我们已经可以在电视、公交站牌、地铁、报纸等多种传统媒体身上发现搜索的影子,这个小小的搜索框可以帮助企业了解消费者的主动需求,从而为后续的营销方式做准备。搜索引擎将营销前消费者行为分析、找到并捕获目标消费者、对之进行行之有效的营销活动、营销后效果评测等环节串联起来,形成一个整合营销闭环,在当中起到关键的链接作用。
另外,搜索作为电子商务网站的天然人口推动了传统企业的电子商务化进程。越来越多的传统企业正在进***电子商务领域。李宁、玉兰油、优衣库、兰寇、海尔、联想、戴尔等纷纷上马,进驻电子商务网站。分析人士指出,未来传统品牌商建立***的电子商务平台并与搜索捆绑将会成为B2C主流模式之一。
搜索 成为大入口
经过十多年发展,搜索引擎已经从当初的几条相关链接,发展到现在的智能“框”。在这个框里,搜索引擎甚至能够满足用户“北京哪里能找到女朋友结婚”这样的搜索需求。今天,当你提出一项搜索请求时,搜索引擎呈现的或许是一个网页,或许是一个应用程序,或许是一家鲜花店的地址,或许是一个计算器,或许是一个列车时刻表。它能够直达消费者内心,展现消费者最想要的信息。从这个意义上讲,搜索引擎才是互联网真正的人口!
一方面捕获了目标消费者,另一方面链接了品牌广告主进行整合营销的关键环节,这个人口承载了消费者、品牌、广告主、媒介、应用等诸多元素,应和着消费者行为变化和广告主投放的需求。
2009年8月18日,百度CEO李彦宏描绘了搜索应用的未来蓝***:把所有用户的需求(包括消费者要找的产品信息和各种各样的应用)都集成到一个框里,用一个框来满足用户的需求。这个全新的计算平台,就是“框计算”。而框的外形,正是对人口的完美阐释,框计算所描绘的未来蓝***,包容了百度作为大人口的真正作用。
搜索改变生活篇2
搜索是网络时代需求的表达
当今社会,网络应用已经充斥着我们生活的每一个角落,引发了整个社会的变革。人们的生活离不开网络,有问题(需求)上网去寻找答案,已经成为人们的一种习惯。网络搜索成为人们获取信息和了解未知世界的主要渠道。
为了解当代消费者信息获取方式的变化,以及这些变化到底在多大程度上影响到企业的营销模式,2006年我们就此展开调查。调查围绕两个问题展开:
问题一:当你参加一个大型商务活动时,偶尔听到一个消息,看到一个广告或看到某一样东西(商品),并对此(或其中的内容)感兴趣时,下一步你会通过什么渠道、什么方式去获取进一步信息?
问题二:当你出于工作或生活需要(前提是,没有受到过任何广告等营销信息的影响,完全出于生活和工作的本能)想要了解某项业务、某项服务、某个产品或某个供货商时,你会通过什么渠道、什么方式去获取进一步信息?
调查给出的回答选项有四个:查电话(如推销员、业务员、老客户等留下的联系电话记录等);问朋友(如同行、业务伙伴、朋友等);上网搜索;找广告(设法查找曾经看过的广告或企业宣传资料)。结论显示,绝大多数人的选择都是上网去搜,而选择其他选项的人很少(如***1所示)。
与此同时,国际互联网应用咨询机构GlobalSpec在美国300多家工业企业中所做的调查也得出了几乎完全相同的结论(如表1所示)。
这表明,当今客户信息获取方式发生了很大的变化,上网搜索已经成为客户有需求时的首选方式。客户的信息获取方式变了,企业的营销传播方式就一定要跟进,在营销传播的方法和手段上有所创新。当代消费者信息获取模式的改变,是当今网络营销和搜索引擎营销流行的主要原因。
根据上述调查的结果,多数人有了需求后都会上网去搜,那么,这些搜索请求实际上就是互联网时代人们需求的一种表达方式。每天搜索引擎上有数以亿计的人次访问,这些都是出于对某种信息、知识、商品或服务需要的表达。
因此,从这个意义上来看,搜索的本身就是网络时代人们需求的表达!是市场和需求产生的源头。抓住这个源头对企业或营销来讲,至关重要。
据艾瑞咨询2009年统计:仅中国大陆2008年通过网络提交的搜索请求高达1500亿人次(这还不包括一次多词,或多次重复搜索),其中直接或间接表达目标商品或购物的需求占28.4%。国际上类似的统计,数量也是高得惊人(如表2所示)。以美国为例,据ComScore公司的统计,2008年在美国通过网络提交的搜索请求高达1370亿人次。全球仅2009年7月一个月的搜索请求就高达1130亿人次(ComScore,2009.8)。
面对如此巨大的来自消费者的需求表达,哪个企业会无动于衷?!
你要找的人也在千方百计找你
在生活中,人们经常会看到这样一种奇怪的现象:一方面很多企业抱怨现在市场和需求不足,消费者不愿意花钱,生意不好做,有了好的产品也很难寻找市场;另一方面众多的消费者(客户)在满世界寻找他们所需要的商品(产品)。真的是市场不足、缺乏需求吗?显然不是。现阶段企业真正缺乏的不是市场和需求,而是新技术环境下的市场沟通能力和网络营销执行力。
2009年我们以“高温防暴电磁阀”和“波峰焊”两个关键词为例展开分析。对于这样一些非常生僻、专业、精准,普通百姓根本不可能会主动想到的关键词(更不可能主动上网去搜),一个月内在某个占市场份额不算太大的搜索引擎上,居然有高达数百人次的搜索请求(前者284人次,后者305人次)。如果在这之中有1/3是出自于客户采购目的而搜索(寻找产品或供货商),其中蕴涵的商机惊人!
另一方面,如果客户用这两个关键词上网去搜的话,使用任何一个搜索引擎能查出的相关信息都在百万以上(还是以上述搜索引擎为例,搜索结果是前者有1,270,000条,后者有1,450,000条)。如果在这其中有1/1000是出自供货商的广告信息,那么竞争就会异常激烈。谁能先抓住客户的眼球,引发客户的关注和兴趣,谁就会决定这些需求和业务的流向!
所以,在当代网络环境下,爆炸性增长的海量信息对企业来说既是机遇,也是挑战。如果不能掌握准确的方法,企业要想在茫茫人海中找到目标客户并非易事;反之,客户要在浩浩的企业之林中,寻找到自己满意的产品或供货商也十分困难。
据我们研究,现阶段企业有了好产品而找不到市场和客户的主要原因,是没有掌握正确的营销传播方法和市场沟通手段,企业营销和客户需求之间缺乏有效沟通的桥梁。如果我们认真分析当今客户的信息获取方式以及他们***搜索、选择和浏览行为,探索其中的规律,展开搜索引擎营销 (SEM,search engine marketing) 则大有可为。
近年来,随着网络营销知识的普及,很多企业都意识到了SEM的重要性,投入了很大的力量展开搜索引擎营销。在近几年各类网络媒体广告的投放形式中,SEM是发展最快的,可谓是一枝独秀(如***2所示)。2010年的市场规模超过百亿元(人民币)。
但是,不得不指出,尽管我国SEM市场发展速度很快,但实际的营销效果却并不太好。其主要原因是企业没有了解SEM的规律,盲目投放。
既然搜索本身就是网络时代客户需求的一种表达,那么,客户有了需求后会如何表达?用什么词语、什么工具来表达?用什么方法去搜?其中有什么规律?这些细节对企业来说都至关重要。
2007年初我们研究发现:由于消费者(客户)个体存在差异性,人们在需要某种商品时的搜索用词、表达方式和选择行为会有很大的不同。
我们选择的研究对象为汽车(购车),试验分别在清华大学经管学院的在职MBA学生和一年级大学生中展开。选择这两类人群的原因,前者是有现实需求、甚至是持币待购客户群体的典型代表,购买动机很强;后者属于普通大众中的爱车一族、企业的潜在客户,但距离购买还为时尚早。
当问及MBA学生是否有购车计划,以及购买前是否会上网搜索相关信息时(包括新车型介绍、评论/口碑、比较性能、价格等),回答百分之百是肯定的。当再问及他们分别会用什么词、什么方式去上网搜时,答案五花八门。多数人(68%)会用某个品牌且目标很明确(绝大多数都集中在:雅阁、领驭、马自达6、君悦、凯美瑞等);也有人用某种车型(如SUV、MPV、B级车等);或用某个价格或排量区间(如15到25万之间,排量2.4升以下、1.8T、2.0T)。值得特别指出的是,“汽车”一词很少有人使用。
而同样的问题在一年级学生中的调查结果却完全不同。他们上网搜索时,不但用词五花八门,而且表现出很强的盲目性。他们上网搜索相对使用最多的词是“汽车”,除此之外,如跑车、法拉利、保时捷、劳斯莱斯、奔驰、宝马、宾利等都有可能用来作为搜索关键词。
这种现象表明:搜索用词的本身就反映了客户的需求动机和个体偏好。不同个体特征和需求动机的人,在需求表达、搜索用词和对搜索结果页面关注度分布上都会有很大的不同。
什么因素左右消费者的选择(点击)行为?
为了进一步分析到底是什么影响了客户的选择行为,我们针对当时多数受访对象最感兴趣的“帕萨特・领驭”轿车展开深入分析。我们让两组不同的实验对象分别上网查询“领驭”轿车的相关信息(如***3所示),以观察不同客户群对关键词定位广告的反映。
为了研究各相关因素对消费者选择行为的影响,在研究中我们修改了原始搜索页面的内容,故意拉大某个搜索结果项内容和右侧关键词定位广告内容与关键词之间一致性的差距,同时变换它们的相对位置,观察两类不同人群选择(点击和浏览)行为的变化。结果发现:搜索者的个体特征、需求的目标定位和搜索动机的强弱等,都会对他们的选择(点击)行为产生很大的影响。搜索结果项(或关键词定位广告)的文字特征、营销诉求与关键词所反映出的客户个体特征和搜索动机之间的一致性(相关程度),是左右客户注意力和选择行为的关键因素,其次才是位置。
一个明显的例证是:定位在关键词“帕萨特・领驭”下的欧宝轿车广告,对MBA学生(购买目的和搜索动机强的客户群)来说,不论我们如何改变关键词的位置和内容,总会有一定的点击率(CR,click rite),只不过会随定位广告内容一致性(广告短语与关键词的相关程度)的不同,点击率有较大的差异而已。一致性越好,点击率越高。位置在一定范围内变动对点击率影响不大。
而同样是定位在关键词“帕萨特・领驭”下的克莱斯勒300C轿车广告,无论我们怎么改变位置和内容都无人问津。究其缘由非常明显,搜索“帕萨特・领驭”轿车的人大多属于中级轿车的消费群体,其购车预算(计划)大多在24万以内,欧宝与他们的需求非常吻合(一致性非常好)。而克莱斯勒300C(当时市场标价大约在40万人民币左右)明显高出了他们的预算范畴 (一致性很差)。
但对另一个被试群体、一年级大学生来说(暂无购买计划、需求动机不明确的客户群),他们的关注度和选择(点击)行为表现得很散乱,具有很强的盲目性,且更容易受到与购买无关的其他因素的影响。
研究结果还发现,如果我们能适当地增强广告内容与搜索用词(关键词)之间的一致性,就可以在很大程度上改变客户屏幕关注度的分布和实际点击率。此规律在搜索动机强的客户群体中表现得很明显(如***4所示)。
上述研究表明:由于消费者个体条件的差异性,人们在面对同一种商品时的搜索用词和选择行为会有很大不同。
首先,不同个体特征的人在搜索动机和搜索用词的选择上有很大的不同,真正的客户通常目标(用词)非常具体、精准,而普通大众用词却非常宽泛,漫无边际。
其次,人们会根据个体偏好、搜索目的和购买预算来选择点击(浏览)相关的内容,而且购买(需求)目的性越强的人,其选择(点击和浏览)行为就会越精准,越有规律性。反之,就越分散,越没有规律。
再次,搜索结果页面信息与客户搜索动机(通过搜索用词来体现)之间的一致性,是左右人们选择(点击)行为的主要因素,其次才是所在的位置。
在现实生活中,消费者种类繁多,网络搜索的动机五花八门,企业对此是无法控制的,但是在进行网络营销时对关键词的选定、广告(或搜索结果显示项)的文字特征、营销诉求和与关键词之间的一致性,企业是完全可以自主控制的。只要企业在制定搜索引擎营销策略时注意到上述规律,加强广告内容的一致性,就可以吸引客户的眼球,抓住购买动机很强的客户,大幅度地提高广告被点击的可能性(如***4所示),实现“让客户主动来找你”这一企业营销的终极目的。
搜索营销策略三大铁律、八项注意
搜索改变生活篇3
这并不只是因为李彦宏的“IT界第一帅哥”头衔——他创立了全球最大的中文搜索引擎百度,进而改变了中国人的信息获取方式。“没有了搜索,那还叫网络吗?”在上海浦东机场工作的Luke无法想象这种“与世隔绝”的生活。“我喜欢追寻热点新闻,喜欢在查找信息的过程中和志趣相投的朋友们交换信息。小时候没网络,遇到不懂的问题只有问人或者看书,现在求人不如求度娘(百度的拟人名称)。”
搜索引擎刚诞生时,只有一群程序员、技术高手才会使用。而到现在,它已经不再是“阳春白雪”,开始“飞入寻常百姓家”,并且与人们的衣食住行融为一体。“有问题,百度一下”成为中国网民日常生活的真实写照,而“百度一下,你就知道”更是形象地表现了搜索引擎的无所不能。搜索引擎对人类的真正最大贡献实际上是改变了人们的生活,很多人的行为模式发生了悄然的改变。
如果说谷歌的崛起重新定义了整个互联网行业的发展方向,它对中国的影响则是通过影响百度来真正达成。1999年,当从美国硅谷辞职的李彦宏带着120万美元的风险投资和“超链分析”专利技术回国时,谷歌对中国市场还处于放任自流的状态,中国也还没有一家成规模的搜索公司。当时市场上和中文搜索最接近的服务是“3721网络实名”,其提供的服务实际上仅仅解决了国人的语言障碍——在浏览器地址栏中输入中文就可以检索到相关网站。但仅凭这项技术,2001年成立仅3年的3721就在中国互联网企业中率先宣布盈利,可见用户对中文搜索的期待。
2000年,名字源于南宋词人辛弃疾《青玉案·元夕》中名句“众里寻他千百度”的百度公司成立。从2003年起,谷歌在中国市场上的流量开始落后于百度。据中国互联网络信息中心《2011年中国搜索引擎市场研究报告》,有高达95.3%的用户在使用搜索引擎时首选百度。
搜索改变生活篇4
无论是全球互联网市场,还是中国市场,搜索都需要颠覆性的创新,颠覆过去搜索概念,坚持平台开放。
国际搜索风起云涌
5月16日,谷歌了“知识***谱”,这是一款被业界视为新一代“智能”搜索的代表。 相比传统搜索结果页,这种搜索模式下的搜索页面,并不与Google用户进行搜索的关键词直接匹配,而是提供与词汇所描述的“实体”或概念匹配的页面,显得更为智能化。
同时,微软必应搜索也悄悄地进行了改版。据说新增了一个名为Snapshot的中间栏,显示实用的任务导向内容,帮助人们预订餐厅、指路或查看电影场次等。必应最独特的新功能是一个叫做Sidebar的右边栏,用以自动显示在某个特定问题上能给你提供帮助的相关Facebook好友以及其他网友的名字。这样的改版将鼓励网络搜索变成团体活动。
5月下旬,雅虎的搜索团队也正式推出了iOS平台的浏览器Axis,以及适用于Chrome、Firefox、IE、Safari等桌面平台的浏览器插件。用雅虎搜索团队产品主管Ethan Batraski 的话来说,这个浏览器的最大优点就是将传统的搜索流程“输入问题——查看结果——进入页面”简化为“输入问题——进入页面”。在体验中,记者发现,Axis解决了一个关键问题——将搜索结果可视化,并简化了用户寻找最优结果的流程。
谷歌、微软、雅虎搜索的共同点都是让搜索变得更简洁和智能化。对此,陈沛对记者表示,搜索一定需要发生某种变革,以满足互联网信息的不断增长。在国际市场,每年都会有新的搜索理念向谷歌发起挑战;而在中国搜索市场的变革,也是迟早的事情。
国内“第三代”兴起
艾瑞统计数据显示,今年第一季度,中国搜索引擎市场规模达54.9亿元,增速较去年同期降低。从市场格局来看,百度的市场份额增长到77.6%,搜索市场集中度进一步提高。
面对百度在中国搜索市场一家独大的局面,陈沛认为,搜索需要颠覆性创新而不是微创新,要颠覆过去的搜索概念。而做到这一点的前提就是开放平台,让所有网民都有机会参与到搜索结果的挖掘。 因此,2011年10月,中搜率先推出了第三代搜索引擎平台,成为国内首个直接开放搜索后台给普通用户的知识分享型搜索。
传统的智能语义分析技术,仅通过对关键词的数学计算进行匹配分析,并以列表罗列的方式展现,已经不能满足用户的复杂需求。在搜索引擎技术抓取信息后,必须引入人类的智慧以及对不同领域专业知识的积累,将匹配出的信息进行重新整合、筛选及排序,从而构成更加符合用户需求的搜索结果页面。陈沛认为,这种强调将搜索引擎核心技术与人工智慧高度结合的模式,就是第三代搜索引擎平台的核心。
“中国的搜索会越来越专业和开放,但成功者可能寥寥无几,因为很多内容资料一直掌握在传统企业里。中搜搜索把人工智慧加入搜索技术中,是多方知识的融合。中搜第三代搜索引擎平台将通过开放的战略,与传统企业一起构筑搜索服务。”这是陈沛对第三代搜索引擎平台的希望。
记者注意到,中搜第三代搜索引擎与Google知识***谱一样,也针对相互关联的事物与背景进行编篡和整合,形成更加全面的搜索结果。
陈沛认为,随着搜索引擎市场的发展,未来人的知识会变得更重要,中搜目前的平台能让搜索结果一目了然。搜索引擎的改变要颠覆以往列表式方式,以全新的综合结果出现,集合与这个关键词相关的最精准信息,如视频、百科、***片、SNS、问答等,而这些是通过人的智慧加入开放搜索平台上而产生的全新搜索结果。
记者观察
开放是搜索的精髓
虽然2012年第一季度中国搜索引擎市场规模已经超过50亿元,但随着智能手机、平板电脑等移动智能终端的大量普及,移动搜索市场用户规模不断扩大,移动互联网时代的搜索将走向何方呢?
最近,人民搜索总经理邓亚萍称,人民搜索排名第三引发了热议,焦点是其开放性;由新华社和中国移动联手打造的搜索引擎搜索,之所以难以脱颖而出,主要受制于其体制——因为开放是互联网的核心,更是搜索的命脉。
搜索改变生活篇5
[关键词] Lucene 新闻搜索引擎 Pagerank 中文分词
一、引言
当今社会随着信息化的快速发展,信息的获取已成为人们生产生活最频繁最重要的活动之一,Internet的发展改变了传统的信息传输渠道,大量的信息甚至可在短短的几秒内就从地球的这端传到那端。
新闻信息的已历经从传统的纸质媒体到电子媒体的变革,各新闻门户网站也如雨后春笋般涌现,科技的变革往往带来生活方式的变革,人们获取新闻信息的方式也从传统的被动接受方式转变成主动搜索方式,甚至将来的交互式问答方式。在其中发挥核心作用的就是信息检索技术。目前,尽管Google等搜索引擎公司推出了新闻搜索系统,但其技术未予公布,用户也无法对其改进以使系统更加个性化,而且,各类信息提供商也经常需要提供搜索引擎来方便用户对信息的获取。因此,研究专业信息领域的搜索引擎技术有着重大的意义和巨大的市场价值。本文研究中文新闻搜索引擎的构建技术,并基于开源的Lucene[1] java软件包实现了一个原型系统。
二、系统概述
1.设计目标
本系统考虑新闻检索的特点,如时效性、权威性等特点,基于Lucence,引入网页解析技术提取网页中的新闻,利用中文分词技术对新闻内容分词,同时引入PageRank技术对评分系统进行修改,使其能够很好地满足用户需求。
2.系统框架
Web搜索引擎的建立,包含从网页文档抓取,解析,再到建立索引,搜索,是一项复杂的工作。在本研究中,新闻网页数据集选自新浪,搜狐,雅虎,中国新闻网等权威门户网站,系统不仅能实现一般的Web搜索引擎提供的关键字搜索,同时它又有别于一般的Web搜索引擎,可以满足用户对新闻搜索的特殊需求。系统先利用WebZip工具从不同的新闻网站定时抓取网页,将网页保存于本地磁盘,然后利用Htmlparser解析网页以提取其中的新闻内容,时间,***链接,本地路径。对***链接用PageRank技术计算其重要性;利用中文分词技术对新闻内容进行分词,再由Lucene分析器进行分析,结果提交给索引器建立索引。将索引结果和PageRank值提供给搜索器,在用户对搜索器发出请求后,返回相应的查询结果。
三、系统模块和设计
1.抓取网页
我们使用软件Webzip作为抓取网页的工具,由于待抓取的是新闻网页,我们选择了几个权威的网站(搜狐,雅虎,中国新闻网)作为我们实验数据的来源,具体步骤如下:
首先,创建一个工程,并在工程的地址栏中输入待抓网页的网站根目录如news.省略。
其次,在工程的属性中进行一系列的选择:filetype选择HTML,在linklever中选择all level表示可以抓取任意层次的网页,在pagelocation中选择within current site表示只抓取该网站的网页。
我们用Webzip总共抓取了700多兆的数据量用于实验。
2.HTML解析与中文分词
由于Lucence只支持txt等纯文本格式的索引,对于HTML这类包含标签的数据我们需要进行解析过滤后才能进行索引,我们利用开源的HTMLParser[3]对网页进行解析,提取网页中的新闻标题,时间,新闻内容和链接地址,滤掉标签等不必要的信息。我们将解析器解析出来的文本利用中文分词工具ICTCLAS[4]进行分词后传递给Lucence的索引器建立索引。
3.建立索引
先利用Lucene的分析器去掉常用词,统一大小写,替换同义词等。然后就可以对四个域进行索引,分别是”paths”,”contents”,”time”,”title”。这样搜索就可以建立在这四个域上,根据不同的搜索需求对不同的域进行搜索。比如需要查某个时间的文档,就只需要搜索”time”域。
4.建立搜索函数
在索引建好的基础上我们需要建立搜索API, Lucence的搜索机制是根据用户输入的关键词,用其分析器(这里我们先用ICTCLAS进行中文分词)分析关键词,再将分析结果传给搜索函数进行搜索,返回命中文档的集合。在本系统中我们提供了两个搜索函数:一个是Lucence搜索函数的改进版,它结合Lucence的评分规则和PageRank;另一个根据时间排序。
在搜索引擎的研究中,一个核心问题就是评分规则的确定,如何确保用户感兴趣的网页或重要的富含信息的网页得分较高,这是一个较难的工作,也是一个研究热点。较成熟的方法包括向量模型,贝叶斯网络等。Lucence采用的是向量模型,基本思想是将文档依据关键词映射到一个向量空间,根据词频和逆词频来计算文档的权重,然后计算查询向量q和文档dj的相似度,此相似度便作为查询文档的得分。由于Lucence只考虑了文档自身的内容,没有考虑文档间的关系,而文档间的引用关系往往能反应文档的重要程度;就比如经常被引用的论文往往是好论文,尽管可能它的文档内容得分不高,但因为它足够权威,我们还是要提高其得分。PageRank便基于类似的思路利用网页间的链接关系来计算网页的重要性,该技术已经应用在Google上。于是我们引入Pagerank对Lucence的评分机制进行修改,在计算向量模型时加入Pagerank的值,再进行规范化处理。
5.重要新闻的提取
之前我们所做的工作主要是给用户提供关于新闻的搜索功能。除了搜索服务,我们在网页上还要提供给用户一个新闻浏览的平台,让用户知道现在什么新闻最重要,甚至可以在将来开发个性化推荐系统。因此提取重要的新闻是一项很关键的工作。在我们的研究中,该问题的解决方法如下:
A.首先提取每条新闻的标题,利用Lucene分析器对标题去除停用词并进行分词。
B.对每个标题,我们根据向量模型比较它与其他标题的相似度,得到其分数titlescore。
C.对于新闻出自的网站按其网站的重要性对每个网站赋予不同的权值weight。
D.对于新闻的出现位置,我们认为它对评分也有影响,采用如下的公式:timescore=1-i/(2*legnth)。其中i表示该新闻在网页上所处的位置,length表示当天总的新闻数。
E.最后我们综合所有的评分因子得到如下的公式:
score=titlescore*timescore*weight*(1+0.2*title.length());
按照score从大到小输出当天的部分重要新闻。
实验表明,重特大新闻和一些关注较多的新闻都排在了前列。
6.Pagerank的计算
Pagerank是Google使用的根据网页之间的链接关系,给出网页权重的一种算法。其基本思想为:当网页A有n个链接指向其他网页时,将网页A的rank值分为n份,分别赋予这n个网页。对网页集合中的所用网页使用迭代计算的方法反复计算,直到收敛到一个不动点为止。我们采用中的算法。
四、结束语
系统采用Tomcat作为Web Server, 使用Jsp/Servlet架构,界面提供按内容相似性和时间两种排序方式,实现了中文分词,Pagerank等技术;并根据新闻搜索的特点提出了相应的算法;取得了较好的搜索效果。在将来,对于用户推荐,热点新闻识别等,亦有很多研究工作有待开展。
搜索改变生活篇6
据南方日报记者了解,目前通过微博进行的营销方式已经成为微博平台的全新尝试,也为互联网营销模式带来了更多的变化。而包括微博营销和搜索营销等在内的全新的互联网营销方式,也在悄然改变着中国网民的习惯。
微博营销互动中的传播
一家螺蛳粉小店,一个被称为“小马哥”的小伙儿,一个微博账号,这些加在一起会产生怎样的化学反应呢?答案就是,人家火了。去年7月,出版过8本小说,获得过“新概念作文大赛”一等奖,跟韩寒、郭敬明同属“萌芽系”的马中才在北京的蓟门桥开了一家螺蛳粉小店,生意不算好也不算坏。为了招揽一些广西老乡,小马哥在新浪注册了微博,没想到几个月他的小店就在网上出名了。从刚开始的几个粉丝,到后来不停被转发和关注,目前,“螺蛳粉先生”这个微博已有近5000名粉丝,小店每天的收益也有4000多元,现在还有不少人开始在他的微博上订餐,平均每天有三四十份之多。
在国外,***零售巨头亚马逊曾在Facebook上做了一些测试,发现朋友间的推荐令亚马逊的购物转换率更高,社交***谱引发了更多的购买需求。以Facebook为代表的社交网络平台已成为企业进行社会化营销的重要场所。如Facebook就推出F-commerce模式,企业品牌可以利用Facebook用户基础,通过Facebook的社交***谱和社交组件进行营销活动,让用户可以与其在Facebook上的好友进行互动、分享和交流的社会化电子商务。
从目前来看,大多数国内的企业微博营销的方式都还比较简单,主要处于品牌曝光的阶段。因此,只有增加参与和互动,才能增加品牌在微博上的影响力,并让消费者与品牌实现深度接触,这也才算是升级版的微博营销。
搜索营销免打扰式的传播
搜索改变生活篇7
知识搜索应运而生
知识搜索服务从韩国起步,经中文互联网进一步发展壮大,这一应用模式扩展到了全球,并且有了英文的服务版本。目前包括百度、新浪、雅虎、腾讯等中国主要互联网公司都提供了知识搜索服务。以百度为例,经过两年的发展,百度知道已经成功解答1700万个问题,日访问量超过1000万人使用,超过国内外所有同类服务商,成为全球最大的互动问答社区。
知识搜索在国内的发展一日千里,主要是中国用户的习惯造就,是个应运而生、应运而长的新事物。由于中国很大部分网民都是初级网民,这部分群体通常习惯于日常生活的口语化表达,而不愿意去用几个关键字来搜索满意答案;并且一些关键字搜索结果是呈现了过多的可选答案,让人看得头晕眼花。比如,一位观看近期热门电影《加勒比海盗3》的观众很想知道“加勒比海盗播出一个小时后响起的背景音乐叫什么名字”,对于这个问题,目前看来搜索引擎恐怕爱莫能助,网民们只有在知识搜索中能得到满意答案。
对非专业人士来说,搜索引擎面临着过于宽泛这一问题。有的搜索引擎采用限制搜索框数字的形式,或者缩短搜索框来改变用户习惯,但效果并不明显。与此同时,很多用户搜索时,都带着问题、因此爱用问句,因此面对用户的搜索长串,知识搜索确实是最好的解决途径。
知识搜索代表明天的方向
最近以来,“威客”一词开始流行,而这个新词的定义就是:通过网站平台进行悬赏,从而找到解决问题的办法。而这种形式,与知识搜索非常相似。据了解更早之前,国外就有了早期悬赏平台,而美国的雅虎、Google等都有相应平台,部分网站甚至已经通过收费的方式实现赢利。当你提出一个问题,很多人帮你搜索然后给出你最准确的答案,这也是搜索引擎未来的一个重要发展方向。
最大化满足用户需求,是知识搜索最大的优势所在,也为搜索引擎带来了新的重要特色。二者互相补充,知识搜索与网页搜索的紧密结合,让所有网民的信息需求得到更好满足的同时,必然也带来更为可观的广告收益。
知识搜索引擎的代表网站主要有:
中国知网,它是目前最大的基于互联网出版的学术知识搜索引擎,数据量大,但缺点是收费,使用不太方便。
百度百科,声称全球最大开放式中文百科全书。是由网友共同编写的一部网络百科全书,知识量较大,完全免费,并且是完全开放式(谁都可以添加或修改)。
太傅知识搜索,是全球最大的中文百科知识库之一。使用方便,完全免费,不完全开放式(可以随便添加,但不可随意修改),知识准确性较高。
新浪爱问知识人,“爱问知识人”汇聚了一亿网民头脑中的所有智慧,来帮助你解决问题!如果你在网上搜索不到你要的答案或资料,那就来“爱问知识人”吧!
百度知道,总有一个人知道你问题的答案
搜搜问问,凡事搜搜看,问问就知道。“问问”是腾讯旗下网站,只要拥有QQ账号,无须注册,可以直接点右上方的登录链接登录。
雅虎知识堂,雅虎知识堂是一种新型态的网络信息交流服务,提供使用者面对日常生活、学习或专业方面的疑问,可以向其他网络使用者请教,或是回答其他使用者提问的一种服务平台。
120ask有问必答,放心医苑网的有问必答,***解答你的问题,给所有网友提供一个解决问题、共享答案的地方。
搜索改变生活篇8
【关键词】信息个人化;群体极化;公共领域;互联网技术
中***分类号:G206.3 文献标志码:A
Potential Drawbacks of Internet
Technology Preferences
Wenjin Lu
(Research Institute of Journalism & Communication, Sichuan Academy of Social Sciences, Chengdu 610072,China)
【Abstract】Information technology has achieved tremendous progress, which not only enhanced our ability to access massive information, but also made netizens more willing to make contact with their own like-minded social circles, which exacerbated the formation of bias and thus caused cognitive bias. This article starts from observing the process of information personalization brought by some network technologies, then analyzes the cause & effects of cognitive bias, and ends with a brief discussion about the impact of Internet technology preferences and our reactions.
【Key words】information personalization; group polarization; public domain; internet technology.
互联网改变了人们的生活,尤其改变了以前单纯依赖电视机、报纸了解资讯的生活方式,互联网的无远弗届使我们能够随时随地看到世界上任何一处的精彩资讯,那是否说明互联网时代的人们比起他们的父辈就一定会更深刻、全面地了解这个世界呢?答案是否定的,因为决定人们认知的因素不仅仅获取的信息量的多少,而重要的是如何接受信息以及在接受过程中如何形成认识的。特别是当信息的供给开始远远大于需求,互联网技术的一些个人化特征会潜移默化地使人们隔绝于封闭的圈子,造成很多偏见甚至极端行为。因此,我们必须重视这一现象,及时研究采取措施,避免一些潜在的威胁。
1、信息接受的互联网变迁
互联网并不是一出生就改变了传统的传播方式,其在中国的发展也是一个渐进的历程,同样人们信息接受的变化也是一个发展的过程,而要判断这一过程就需要先了解互联网技术发展在信息传播的三个阶段:
1.1门户网站的时代
我国的互联网自其商用以来的第一个阶段就是门户网站的时代,以新浪为代表,包括新华网、人民网、搜狐、网易等各类新闻门户网站,门户网站的最大特点就是,通过人工的编辑,从海量的信息中挑选他们认为重要或有价值的信息放在网站的首页或醒目位置。网民所阅读的信息实际上是网站编辑经过过滤的结果,是新闻网站想要给大家呈现的内容,这种信息的过滤实际上跟传统媒体的挑选机制没有多大的差别,都是“经过训练的编辑”推送信息给你看。因此,在互联网的初期,除了信息容量的增大外,本质上与传统媒体时代一致。
1.2搜索引擎时代
搜索引擎的出现从根本上改善了人们获取信息的效率,人们不再是被动地接受编辑打包给我们的信息,我们可以通过搜索引擎自主地寻找想要的内容和信息,通过关键字搜索来拉取信息,为自己量身定制专属于个人的电视台、报纸、广播。所以,搜索引擎的意义就在于帮助我们从海量信息中搜寻并找出自己想要的“内容”,从而满足人们的个性需求,并缓解过量信息带来的焦虑感。
1.3社交网络时代
社交网络最大的特点就是UGC,即用户贡献内容(uesr give content)。包括当年的博客、贴吧、豆瓣及当下流行的微博、微信都是UGC的典型代表,社交网站的提供的内容不再是编辑完成的,而是由用户自发贡献,如Facebook、开心网,人人网、QQ空间这类网站的用户可以更改状态,发表日志,照片,分享视频等,从而了解好友动态;YouTube、优酷网等视频分享网站以视频的上传和分享为中心;Flickr、又拍网等网站主要是分享照片,***片;百度百科、百度知道则网友的你问我答提供平台。另外,在用户提供内容的基础上,用户也会根据某种偏好聚合起来,显现出社交媒体的圈子化特征。如豆瓣组织把有共同兴趣或者爱好的网友聚集在一起,通过用户自我创造与分享内容,形成无数个具有共同话题的小圈子,百度贴吧将对某类话题感兴趣的人聚在一起相互讨论交流。
2、认知偏向的原因
从一般意义来说,在认知偏向的形成过程中,技术因素起着先导因素,而个人习惯则进一步加剧了这种现象:
搜索改变生活篇9
1.互联网向百姓日常生活渗透是不可阻挡的潮流。
百度旗下的Hao123在08年底和09年初做了重要的一次改版。其中重要的两点就是,将生活服务和地方服务提了出来。并且在hao123右侧的主要导航类别里也增加了“生活”一项。地方和生活类站点,未来将会成为中国互联网的重要势力。做不了门户,我们可以做一个地方性的生活站点。
2.用户上网年龄构成向社会人口结构靠近。
百度推出了老年人搜索,加大了hao123的搜索框。百度老年人搜索绝不是偶然的良心发现,而绝对是后台数据说明了这个领域的潜力。互联网十多年的发展,互联网用户人群从过去较为单一的年轻人,转变为比较丰富的人群结构。开始向社会人口结构靠近。现在有老年搜索,那天百度推出未成年人搜索也正常。
3.开放合作是大势。
百度即使技术再厉害,也无法解决所有的事情,无法覆盖互联网所有的数据。因而百度急需要引进第三方来完善用户体验,弥补搜索的不足。谷歌以技术整合一切,而百度的阿拉丁充分展示了百度的营运能力。百度极有可能,对那些用户检索需求很大百度却并没有很好满足用户需求的关键词,进行一次全面的整理,以开放平台的方式来改善体验、丰富搜索结果。
4.移动互联网,下一个3亿网民来临。
百度这半年来在移动互联网领域明显动作加快,跟三星捆绑百度搜索,又与中国联通、中国电信达成合作协议,共同发展3G时代的无线搜索业务。而且据百度内工作人员说,robin史无前例地召见了wap团队。着也充分说明了百度移动互联网的逐渐重视。而移动互联网,即将带给我们的是下一个3亿网民。
5.避免做内容。
搜索改变生活篇10
关键词: 人工蜂群算法; 数字***像相关; 变形; 整像素位移; 动态步长; 交叉运算
中***分类号: TN919?34; TP301.6 文献标识码: A 文章编号: 1004?373X(2013)24?0070?03
Application of improved artificial bee colony algorithm in digital image correlation
YANG Song1,2, SHAO Long?tan1, JIN Feng3, SHI Peng?hui4, CHI Jian?wei5
(1. State Key Laboratory of Industrial Equipments, Dalian University of Technology, Dalian 116024, China;
2. Education Technology & Computing Center, Dalian Ocean University, Dalian 116023, China;
3. Dalian Municipal Meteorological Bureau, Dalian 116001, China; 4. College of Information Engineering, Dalian Ocean University, Dalian 116023, China;
5. College of Science, Dalian Ocean University, Dalian 116023, China)
Abstract: Aiming at the problems of slow convergence speed and easy to fall into local optimal solution, which exist in artificial bee colony algorithms, an improved artificial bee colony optimization algorithm is proposed for the pixel displacement search in digital image correlation. In the algorithm, the search step of the following bee is adjusted dynamically according to the changes of the correlation to balance the capability of global search and local search, and the scout bee employs crossover operation of genetic algorithm to generate new solution for improving the global search capacity. The experimental results show that the improved algorithm can enhance the convergence capability effectively and improve the performance of integer pixel displacement search.
Keywords: artificial bee colony algorithm; digital image correlation; deformation;pixel displacement; dynamic step; crossover operarion
数字***像相关方法(Digital Image Correlation Method,DICM),又称为数字散斑相关方法 (Digital Speckle Correlation Method,DSCM) 是现代光学测量技术的重要方法之一[1],用于实现物体表面的位移和变形的测量。数字***像相关方法在1980年由Peters,Ranson和Yamaguchi同时***提出的。该方法不仅具有其他光学测量方法所具有的全场、非接触测量等优点外,还具有光路简单、对测量环境要求低、便于开展工程现场测量等优点[2],是一种很有应用前途的光学测量方法。
数字***像相关法研究的核心内容是相关搜索方法。早期采用逐点搜索法,这会花费大量时间,后来很多学者对其进行改进,相继提出了Newton?Rapson算法[3]、爬山法[4]、十字搜索法[5]、小波变换法[6]和神经网络法[7]等,这些算法严重依赖于初值的选取,且部分在理解和实现上比较复杂。相比之下,群智算法有诸多优点,可直接把目标函数值作为搜索信息,避免函数求导,可解决目标函数较复杂的问题。目前应用的主要有差分进化(DE)算法[8]、遗传(GA)算法[9]、粒子群(PSO)算法[10]等,这些算法无需计算梯度和二阶导数,是对***像相关搜索方法的有益补充。近年来一些新兴群智优化算法的出现,为***像相关搜索方法的研究增添了新的动力。
人工蜂群算法(Artificial Bee Colony,ABC)是由土耳其埃尔吉耶斯大学的Karaboga在2005年提出的一种基于蜜蜂群智搜索行为的随机优化算法[11]。蜂群算法采用劳动分工和协作的机制,具有控制参数少,计算简洁及易于实现等优点,既能解决连续优化问题,又能解决组合优化问题[12]。函数优化测试表明[13],人工蜂群算法比遗传算法、差分进化算法和粒子群算法具有更好的优化性能,且容易与其他算法相结合进行改进。本文提出改进人工蜂群算法(IABC),应用于数字***像相关搜索中,有效提高了整像素位移的搜索能力。
1 数字***像相关法基本原理
数字***像相关法借助物体变形前后两幅***像的局部相关性来计算得到点的位移值,即在变形前***像中以特定点[x,y]为中心取[2M+1×2M+1]个像素的区域,通过一定的搜索方法在变形后的***像上寻找同样大小子区域的中心[x*,y*],两点位移差为[u,v],见式(1)。位移量[u,v]的计算要考虑两个区域的相关度,见式(2)。
[x*=x+u, y*=y+v] (1)
[C=y=-My=Mx=-Mx=Mfx,y-fmgx*,y*-gmy=-My=Mx=-Mx=Mfx,y-fm2?y=-My=Mx=-Mx=Mgx*,y*-gm2] (2)
式中:[M]为样本区域半径;[fx,y]为***像上点[x,y]处的灰度值;[gx*,y*]为***像上点[x*,y*]处的灰度值;[fm],[gm]为对应区域的灰度均值。相关度[c]取值范围为[-1,1],当参数[u]和[v]为适当值时,两个区域的相关度达到全局最大。搜索位移值[u,v]的过程是求2个区域相关度极值的过程。要计算每个点精确的位移值,可以通过两步法:先粗定位,后细定位。即先计算出整像素位移,然后计算精确的亚像素位移。数字***像相关的搜索时间主要取决于粗定位。相关系数[c]是关于位移值[u,v]的函数,粗定位问题可以看成两个离散整数变量关于相关函数[c]的优化问题,且[u]和[v]被限定在搜索范围内。细定位可以根据相关系数的单峰性近似满足高斯分布的特点,采用相关函数曲面拟合法求极值点来计算亚像素位置[14]。
2 基本人工蜂群算法
人工蜂群算法主要模拟蜂群的智能采蜜行为,蜜蜂根据各自的分工进行不同的采蜜活动,并实现蜜源信息的共享和交流,从而找到问题的最优解。在基本人工蜂群算法中,蜜蜂主要有引领蜂、跟随蜂和侦察蜂。人工蜂群算法在求解优化问题时,蜜源位置被抽象成解空间中的点,蜜蜂采蜜的过程也就是搜寻最优解的过程。引领蜂和跟随蜂根据式(3)进行蜜源位置的更新:
[υij=xij+rijxij-xkj] (3)
式中:[k∈1,2,…,N],[j∈1,2,…,d],[k]和[j]都是随机选取的,且[k≠i],[N]表示解的个数;[rij∈][-1,1]之间的随机数,它控制[xij]邻域的生成范围。
跟随蜂通过观察引领蜂的摇摆舞来判断蜜源的收益率,并依据收益率来选择蜜源。收益率由式(4)可得:
[Pi=fυiji=1Nfυij] (4)
式中[fυi]表示蜜源[υi]的相关度。跟随蜂选择收益率大的蜜源,根据式(3)进行搜索。搜索完毕后,采用贪心选择机制,计算全局最优蜜源位置。
若连续经过limit次迭代后,某个蜜源的相关度没有得到改善,表明此蜜源已陷入局部最优,应该被放弃,与这个蜜源对应的引领蜂转换成侦察蜂,新蜜源位置由式(5)产生:
[xji=xjmin+rxjmax-xjmin] (5)
式中:[xjmax]和[xjmin]分别表示变量的最大值和最小值;[r]是[0,1]之间随机数。通过如此重复搜索,最终找到最优解。
3 基于改进人工蜂群算法的数字相关搜索
3.1 改进人工蜂群算法
跟随蜂在选中的蜜源邻域内按照式(3)进行搜索,其步长具有随机性,算法寻优速度相对较慢,易错过或陷入全局最优解。文献[15]对搜索步长做线性调整,随步长减少,进入局部最优解邻域内也很难跳出。这里将跟随蜂更新蜜源的方法做了修改,步长根据相关度函数值进行动态调整,如式(6)~式(8)所示:
[υij=xij+ωnxij-xkj] (6)
[ωn=e-an/an-1,n=0,1,…,Gmax] (7)
[an=1mi=1mfυni-fυnmax, n=0,1,2,…] (8)式中:[ωn]称为动态步长因子;[fυni]为[υi]在第[n]次迭代时对应的相关度;[fυnmax]为在第[n]次迭代时对应的最优相关度;[Gmax]为最大迭代次数。当[an]为第[n]次迭代时,引领蜂搜索后种群相关度函数的平整度因子,其值根据相关度值进行变换。
在迭代过程中,为防止[anan-1]的值变化过大,采用工程中常用的[e]作为指数,可有效降低比值变化的幅值,使得[ωn]的取值范围在区间[0,1]内。[ωn]的计算充分利用相关度函数的信息,在搜索方向上具有一定的启发性。当[an]变化较大时,[ωn]也就较大,便于大步长搜索;当[an]变化较小时,[ωn]也就较小,便于在相关度极值点附近小步长搜索,这样可以较好地平衡全局搜索和局部搜索能力,不易陷入局部极值。当迭代次数大于limit时,侦查蜂根据式(5)产生新蜜源,式(5)具有一定的随机性,这里提出将被放弃的蜜源与当前的全局最优蜜源进行交叉运算,如式(9)所示:
[υlimit=υmax×p+υlimit×1-p] (9)
式中:[υlimit]为经limit次迭代后相关度没有发生变化的蜜源;[υmax]为当前最优蜜源;[p]为遗传交叉因子。通过运用遗传交叉运算,改善算法的全局搜索能力。
3.2 改进算法的流程
(1)初始化蜜源[υii=1,2,…,N],[υi]为2维向量[ui,vi],根据式(1),式(2)计算各个蜜源的相关度;
(2)模拟蜂群行为,引领蜂根据式(3)搜索最优蜜源;
(3)根据式(4)计算各蜜源的收益率,跟随蜂选择收益率高的蜜源,计算[ωn]的值([a0]为初始时种群相关度函数的平整度因子),并利用式(6)继续搜索;
(4)采用贪心选择机制,更新全局最优蜜源;
(5)若某个蜜源经过limit次迭代后其相关度仍没有得到改善,则根据式(9)得到新的蜜源;
(6)若迭代次数达到设置的最大次数Gmax时,算法结束,否则转到步骤(2)。
4 实验结果与分析
根据文献[16]制作两幅散斑***像,且第二幅***像相对第一幅***像的位移量为(14.3,-5.2)。相关运算的参数设置为:搜索范围设定为40×40 pixel区域,相关运算模板的大小为21×21 pixel,种群个数为50(即引领蜂和跟随蜂各占总数的一半,均为25个),交叉因子为0.9。所用计算机配置为:Intel Core2 CPU(2.8 GHz),2 GB内存。由于优化算法具有随机性,为获得更为一般的规律,故采用统计学方法对随机点(123,87)进行1 000次整像素位移计算,程序采用Matlab编程实现。
分别采用遗传(GA)算法、粒子群(PSO)算法、基本人工蜂群(ABC)算法和改进人工蜂群(IABC)算法进行计算,得到收敛率随迭代次数变化的曲线,如***1所示。
由***1可知,改进算法在55代附近开始接近100%收敛,而其他算法还没达到收敛,表明在种群数相等的条件下,随着迭代次数的增加,改进人工蜂群算法具有更高的收敛率。对计算过程中的迭代时间和收敛率进行拟合,绘制出时间与收敛率的关系***,如***2所示。由***可知,当计算时间在85 s附近时,改进算法已近似100%收敛,而其他算法尚未达到,说明在相同种群数的条件下,改进算法的收敛时间更短。除此之外,还将此方法引入到高维连续函数优化应用中,取得了更为显著的优化效果。
***1 迭代次数与收敛率的关系***
***2 计算时间与收敛率关系***
5 结 语
本文针对人工蜂群优化方法收敛速度慢、易陷入局部最优解的缺点,提出了基于动态步长因子的改进人工蜂群算法。新算法通过适应度值来动态调整搜索步长,改善算法的收敛性能,并借鉴遗传算法的交叉操作,增强群体的优秀特征,加快搜索速度。通过模拟数字散斑***像对算法进行验证表明:本文算法具有较强的全局搜索能力,显著提高数字***像相关中整像素位移的搜索速度。
参考文献
[1] PETERS W H, RANSON W F. Digital imaging techniques in experimental stress analysis [J]. Optical Engineering, 1982, 21(3): 427?431.
[2] 王怀文,亢一澜,谢和平.数字散斑相关方法与应用研究进展[J].力学进展,2005,35(2):195?203.
[3] BRUCK H A, MCNEIL S R, SUTTON M A, et al. Digital image correlation using Newton? Rapshon method of partial differential correction [J]. Experimental Mechanics, 1989, 29(3): 261?267.
[4] ZHAO Wen?zhong, JIN Guan?chang. An experimental study on measurement of Poisson’s ratio with digital correlation method [J]. Journal of Applied Polymer Science, 1996, 60: 1083?1088.
[5] 芮嘉白,金观昌,徐秉业.一种新的数字散斑相关方法及其应用[J].力学学报,1994,26(5):599?607.
[6] 简龙晖,林碧森,刘宁,等.基于小波变换的新型数字散斑相关方法[J].光学技术,2003(7):216?218.
[7] PITTER M C, SEE C W, SOMEKH M G. Subpixel microscopic deformation analysis using correlation and artificial neutral networks [J]. Optics Express, 2001, 8(6): 322?327.
[8] 潘兵,谢惠民.基于差分进化的数字***像相关方法[J].光电子·激光,2007,18(1):100?103.
[9] 陈华,叶东,陈刚,等.遗传算法的数字***像相关搜索法[J].光学精密工程,2007,15(10):1633?1637.
[10] 杜亚志,王学滨.基于粒子群算法的整像素数字***像相关方法[J].计算机工程与应用,2012(6):200?204,208.
[11] KARABOGA D. An idea based on honey bee swarm for numerical optimization, TR06 [R]. UK: Computer Engineering Department, Engineering Faculty, Erciyes University, 2005.
[12] 王慧颖,刘建***,王全洲.改进的人工蜂群算法在函数优化问题中的应用[J].计算机工程与应用,2011(13):36?39.
[13] 张超群,郑建国,王翔.蜂群算法研究综述[J].计算机应用研究,2011,28(9):3201?3205,3214.
[14] 于起峰,尚洋.摄影测量学原理与应用研究[M].北京:科学出版社,2009.