无论是工作还是生活,搜索引擎都是相当常用的工具。
但是,在我的工作经历当中,我发现大部分人并不能正确的使用搜索引擎。无论是实习生还是一些职场老鸟,普遍缺乏有效的训练。
虽然网络上充斥了大量的搜索引擎技巧,但大部分都是和搜索指令相关的。
实际上,在搜索引擎的使用中,指令可能并不能起到很大的作用。
– I –
搜索引擎的第一原则,就是尽量避免使用搜索引擎。
为什么?
因为搜索引擎效率太低了。
虽然“随手百度”已经成了很多人的习惯,但还是效率太低了。
由于竞价排名、信息爆炸以及SEO的滥用,直接导致了搜索引擎获取信息的效率直线下降。
比如,在百度搜索“咨询公司”,蹦出来的全是广告:
所以,在专业领域很少用百度,而是使用专业的数据库或搜索工具。
在咨询公司里,常用的工具包括:
零售数据一般会向尼尔森、益普索或者Euromonitor购买;
宏观数据有国家统计局、各类年鉴以及万能的WIND;
金融数据有Capital IQ,Thomson One;
冷门行业的数据,基本会通过专家网络公司(如GLG,Capvision等)直接联系行业专家。
以上这些信息,如果想通过搜索引擎,基本只有三个结果:
1. 完全搜不到;
2. 非常零碎,需要花大量的时间整理;
3. 整理出来后发现缺了很多数据点,不完整。
– II –
在什么情况下,才需要用到普通的搜索引擎(比如百度和谷歌)呢?
> 陌生领域
在遇到完全不了解的领域时,搜索引擎是非常好的扫盲手段。
搜索引擎可以有效地链接到各类百科网站、问答网站以及一些数据库,帮助我们建立基础概念。
> 碎片化信息拼凑
部分信息缺乏统一的发布渠道,散落在各类新闻稿、博客自媒体中,这时候就需要搜索引擎的强大检索功能了。
做过宏观研究的都知道,国家统计局数据库http://data.stats.gov.cn/中的数据往往有一定的滞后性,一般滞后一年左右。
如果要找2017年的人口数据,国家统计局的网站还没披露。
这时候就需要通过搜索引擎搜索,可以通过搜索新闻稿中披露的人口信息。
– III –
想要更好地使用搜索引擎,必须理解背后的工作原理。
搜索引擎是如何工作的?
首先,搜索引擎利用网络爬虫程序,将爬到的网页储存起来。
然后,整理这些网页,建立索引库。这个索引库不仅包括网页上所有的词语,还记录了这些词语的位置、频率等信息。
当我们在搜索关键词时,搜索引擎做的工作简而言之就是将“关键词”与索引库收录的“词语”进行匹配,然后向客户呈现符合要求的网页内容。
整个流程如下图所示:
因此,搜索的首要原则就是使用“关键词”搜索。
很多人搜索的时候是把整个句子输入搜索框,这其实会干扰搜索结果。
我们需要做的,就是把最关键的词语输入引擎。
以下有几个小技巧帮助我们获得更准确的关键词
1. 积累专业词汇
在专业领域做信息搜索,积累专业词汇并不可少,并且要中英双语。
客户旅程是消费品、零售等行业非常常用的一套方法论。
如果用中文搜索“客户旅程”,就会发现明显干货不多,还有很多混淆视听的结果。
而使用英文“customer journey”,搜索结果、联想结果都明显更加准确。
此外,在很多专业领域,都有一些专业词汇,而这些词汇往往会以俗语的形式出现在网络上。
在这种情况中,不仅要积累词汇本身,还要熟练掌握这些词汇的“俗语”,在搜索时灵活切换。
2. 同义词/近义词/错别字
很多词语都有同义词和近义词,导致网络上很多信息在表达同一个事物时,会使用这些同义词和近义词。因此在搜索时要多探索不同的可能性。
太阳能(solar)发电和光伏(photovoltaic)发电就是一组近义词。
实际上光伏发电是属于太阳能发电的一种。
但由于今年光伏行业的发展,现在很多文章已经将这两个词等同了。
研究光伏行业时,这两个词都必不可少。
还有的时候,有一些专业词汇容易打错或认错,这时候尝试一下“错误”关键词,说不定就会收到意外惊喜。
3. 用关键词搜索关键词
在陌生领域,没有积累过关键词怎么办呢?
这就需要用搜索到的关键词来搜索新的关键词。
搜索中国环保行业的驱动因素,很多报告都会提到“政策”。
将政策作为关键词,我们就会得到“水十条”“大气十条”“2+26”等一系列政策性关键词。
再去搜索这些关键词,我们就可以知道这些政策具体是什么、要做什么,从而判断粗政策对环保行业的影响。
另外,将新的关键词与旧的关键词结合,比如“2 26 大气”,就可以获得很多更深入的信息。
4. 善用指令
以上技巧都做好之后,才是谈指令的时候。
时刻要记住,指令只是工具,只是为了更好地逼近关键字。
接下来我们详细聊一聊指令。
– VI –
常用的指令有四个,百度和谷歌都支持这四个指令。
A. 双引号
把搜索内容放在双引号中,代表完全匹配搜索。
也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。
B. 减号
减号代表搜索不包含减号后面的词的页面。
需要注意的是,使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。
比如,搜索【战略咨询公司 -麦肯锡】,就是搜索所有战略咨询公司相关,但不含麦肯锡的内容。
C. site
site指令专门用来搜索某个域名下的所有的内容,换句话说,就是把搜索限定在某个网站上。
比如,我们要搜索罗兰贝格网站中所有关于汽车的内容,就用【汽车 site:rolandberger.com.cn】。
D. filetype
专门用于搜索特定文件格式。
比如,要搜索pdf版本的金字塔原理电子书,就用【金字塔原理 filtype:pdf】。
以上是常用的指令。
此外,还有一些不常用指令(如inurl,inanchour等),部分指令百度不支持。
下表是总结后的指令名称、用法和示例,以后搜索引擎只要保存这张图片就够了。