可以用搜索引擎吗?当然大家都会!
根据2019年搜索引擎使用报告,大约85%的用户能够找到满意的搜索结果。大多数人只在输入关键词和点击搜索的层面上使用搜索引擎。但这不足以实现高效的信息检索。
围绕搜索引擎,我们将谈谈提高互联网信息检索效率的技巧。
提高检索效率意味着什么?在保证检索精度的前提下,提高检索速度。只有当结果准确时,提高检索速度才有意义。千万不要盲目追求速度,本末倒置。
为什么要提高信息检索的效率?
可以总结为两点:
1.有很多信息。信息爆炸的时代,信息不仅多,而且很杂。网络上充斥着虚假无意义的信息,不关注就会被误导,所以一定要有在沙里淘金的能力。
2.信息很重要:在一个信息化的社会里,能获得什么样的信息对你的决策有很大的帮助。说真的,你得到的信息在某种程度上决定了你。简而言之,信息比大多数人想象的更重要。
选择搜索引擎/信息源?
在搜索信息之前,考虑一个问题,去哪里搜索比较好。
如果你是程序员,问一些技术问题,在Google,stackoverflow或者github上搜索。
如果要搜索学术文献,去知网等各大数据库,谷歌学术也是不错的选择。
想搜索国外信息和英文结果,去谷歌。
如果要搜索国内信息和中文结果,在百度上搜索。
对信息要求高自信吗?高,谷歌搜索,不高,百度搜索。
……
有这样的基本判断,就少走弯路了。
搜索引擎说明
搜索引擎比人们想象的要强大得多,它可以使用指令进行高级搜索。
我们先来看看常规搜索结果的组成部分。
这是“区块链白皮书”的搜索结果,由标题、文本和网站/URL组成。
搜索引擎有以下常见说明:
XXX -YYY搜索包含XXX但不包含YYY的结果
Inurl:XXX搜索url包含XXX结果
标题:XXX的搜索结果出现在XXX搜索的标题中
Intext:XXX搜索内容中出现XXX结果
XXX文件类型:YYY搜索文件格式为YYY的XXX
XXX网站:YYY搜索YYY XXX网站
……
此外,将它们结合起来可以实现更高层次和复杂的检索。
以下是几个实际例子:
你记得你在环球时报网站上浏览过一篇很棒的文章,想再找一遍,但是现在你只记得文章中的几个字——“新冠肺炎世界最大的疫苗厂”,那么我们可以这样搜索:
全球最大的新冠肺炎疫苗工厂网站:环球网
不要小看,这个合适的站内搜索功能,用好了可以实现极大的方便。
我想知道百度有哪些子域,可以这样搜索:
inurl:baidu.com
这样所有网站都会有包含Baidu.com的链接,这是百度的子域。
我想读《鲁滨逊漂流记》,所以我们可以搜索:
鲁滨逊漂流记文件类型:pdf
这样你就会找到鲁滨逊漂流记的pdf电子书。(当然不是每本书都能搜到。我们应该尊重作者的版权。)
我想搜索区块链,并要求搜索结果不包括比特币。我们可以这样搜索:
区块链-比特币
值得提醒的是,不同搜索引擎的说明会略有不同。
当你能灵活运用这些指令获得想要的信息时,恭喜你达到了搜索引擎使用的中级水平。可以多试试搜索引擎说明。
这个话题就不深入讨论了,关键在于个人实践和实战中的进步。
搜索引擎高级搜索
除了使用说明,搜索引擎还支持高级搜索。以百度为例,可以设置在右上角处–>:此页面位于高级设置。
在不熟悉指令的情况下,可以更多的使用这个功能(本质上还是指令)。一目了然,可以自己探索。
信息源白名单
正常情况下,我们会找到一些可靠的信息源,我们可以把它们放在白名单上,以便下次获得可靠的信息。
这些白名单可以包括:网站、个人博客、微信官方账号等等。
如果喜欢在微信官方账号看文章,一定要定期清理自己关注的微信官方账号,照顾好那些劣质的微信官方账号。在不断关注高质量微信官方账号和脱下劣质微信官方账号的反复过程中,可以逐渐沉淀出一套高质量的信息源。
优胜劣汰的逻辑在网站和个人博客上也是一样的。不断的扩展,删除,重复。一段时间后,这份白名单的内容将会丰富而优质。
按照这个方法,目前我的信息源白名单已经收录了近百条,以后有机会再和大家分享。
最后推荐一个信息源:英文维基百科。它的可靠性在所有百科全书中是第一的,很多词条的解释甚至和学术论文一样好。相比百度百科,一个词条引用的次数很少,英文维基百科在一个词条下写了几十上百次的引用。这些条目的引用中有很多可靠的数据源,可以多加关注。里面有很多宝藏。)最好不要用百度百科,不是说全是假信息,而是说既有真信息又有假信息,混在一起你根本分不清。
最后的
综上所述,提高检索效率的技巧。
第一,知道去哪里搜。第二,熟练使用搜索引擎。第三,建立信息源白名单。
最后,练习最重要。[/s2/]
作者:小吴
微信官方账号:硬核卒