科技文献检索学习参考

点赞:25417 浏览:118689 近期更新时间:2023-12-18 作者:网友分享原创网站原创

科技文献检索学习参考

Google搜索从入门到精通v4.0

1.前言

"公欲善其事,必先利其器".Inter只有一个,而搜索引擎则有N多个.有搜索高手说,所谓搜索,就是"在正确的地方使用正确的工具和正确的方法寻找正确的内容".但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大.用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望.不同的时期,涌现出不同的强者.就目前而言,我们非常幸运的有了Google2.摘 要

本文简要的介绍了Google的基本搜索语法和高级搜索语法,Google的特色功能,包括图片搜索,新闻组搜索和集成工具条等.

3.Google简介

Google(Google.)是一个搜索引擎,由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,GoogleInc.于1999年创立.2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎.98年至今,Google已经获得30多项业界大奖.

Google的成功得益于其强大的功能和独到的特点:

Google检索网页数量达24亿,搜索引擎中排名第一, Google支持多达132种语言,包括简体中文和繁体中文, Google网站只提供搜索引擎功能,没有花里胡哨的累赘, Google速度极快,年初时据说有15000多台怎么写作器,200多条T3级宽带, Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果, Google智能化的"手气不错"功能,提供可能最符合要求的网站, Google的"网页快照"功能,能从Google怎么写作器里直接取出缓存的网页Google具有独到的图片搜索功能, Google具有强大的新闻组搜索功能, Google具有二进制文件搜索功能(PDF,DOC,SWF等)搜索入门

要用Google做搜索,当然首先要进Google网站--Google.,第一次进入Google,它会根据你的操作系统,确定语言界面.需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了.

Google的首页很清爽,LOGO下面,排列了四大功能模块:网站,图像,新闻组和目录怎么写作.默认是网站搜索.现在进行第一次搜索实践,检测定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧.在搜索框内输入一个关键字"搜索引擎",选中"搜索中文(简体)网页"选项,然后点击下面的"Google搜索"按钮(或者直接回车),结果就出来了.

搜索:"搜索引擎" 结果:已搜索有关搜索引擎的中文(简体)网页.共约有707,000项查询结果,这是第1-10项.搜索用时0.08秒.

仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍.

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内.

初阶搜索

上例是最基本的搜索,即查询包含单个关键字的信息.但是,你可以发现,上例中,单个关键字"搜索引擎",搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢我们需要进一步缩小搜索范围和结果.

.1搜索结果要求包含两个及两个以上关键字

一般搜索引擎需要在多个关键字之间加上"",而Google无需用明文的""来表示逻辑"与"操作,只要空格就可以了.现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有"搜索引擎"和"历史"两个关键字.

示例:搜索所有包含关 键 词"搜索引擎"和"历史"的中文网页 搜索:"搜索引擎历史" 结果:已搜索有关搜索引擎历史的中文(简体)网页.共约有78,600项查询结果,这是第1-10项.搜索用时0.36秒.

用了两个关键字,查询结果已经从70多万项减少到7万多项.但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的"历史",并不是我们所需要的"搜索引擎的历史".怎么办呢删除与搜索引擎不相关的"历史".我们发现,这部分无用的资讯,总是和"文化"这个词相关的,另外一些常见词是"中国历史","世界历史","历史书籍"等.

.2搜索结果要求不包含某些特定信息

Google用减号"-"表示逻辑"非"操作."A–B"表示搜索包含A但没有B的网页.

示例:搜索所有包含"搜索引擎"和"历史"但不含"文化","中国历史"和"世界历史"的中文网页 搜索:"搜索引擎历史-文化-中国历史-世界历史" 结果:已搜索有关搜索引擎历史-文化-中国历史-世界历史的中文(简体)网页.共约有36,800项查询结果,这是第1-10项.搜索用时0.22秒.

我们看到,通过去掉不相关信息,搜索结果又减少了将近一半.第一个搜索结果是:

搜索引擎直通车≡搜索引擎发展历史 搜索引擎直通车..搜索引擎专业介绍站点.... se-express./about/about.-14k-网页快照-类似网页

非常符合搜索要求.另外,第八项搜索结果:

463搜索王 本站检索整个网站在此输入关 键 词.你的当前 位置:首页>,>,Inter搜索手册>,>,搜索引擎的历史.... co./search/history.-21k-网页快照-类似网页

也符合搜索要求.但是,10个结果只有两个符合要求,未免太少了点.不过,在没有更好的策略之前,不妨先点开一个结果看看.点开se-express.的这个名为"搜索引擎发展历史"的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具"Archie"息息相关的.此外,搜索引擎似乎有个核心程序,叫"蜘蛛",而最早成型的搜索引擎是"Lycos",使搜索引擎深入人心的是"Yahoo".了解了这些信息,我们就可以进一步的让搜索结果符合要求了.

注意:这里的""和"-"号,是英文字符,而不是中文字符的"+"和"-".此外,操作符与作用的关键字之间,不能有空格.比如"搜索引擎-文化",搜索引擎将视为关键字为"搜索引擎"和"文化"的逻辑"与"操作,中间的"-"被忽略.

.3搜索结果至少包含多个关键字中的任意一个

Google用大写的"OR"表示逻辑"或"操作.搜索"AORB",意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B.在上例中,我们希望搜索结果中最好含有"archie","lycos","蜘蛛"等关键字中的一个或者几个,这样可以进一步的精简搜索结果.

示例:搜索如下网页,要求必须含有"搜索引擎"和"历史",没有"文化",可以含有以下关键字中人任何一个或者多个:"Archie","蜘蛛","Lycos","Yahoo". 搜索:"搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化" 结果:已搜索有关搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化的中文(简体)网页.共约有8,400项查询结果,这是第1-10项.搜索用时0.16秒.

我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求.如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧.

注意:"与"操作必须用大写的"OR",而不是小写的"or".

在上面的例子中,我介绍了搜索引擎最基本的语法"与""非"和"或",这三种搜索语法Google分别用""(空格),"-"和"OR"表示.顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用""连起来),目标信息不能含有的关键字(用"-"去掉),目标信息可能含有的关键字(用"OR"连起来).

杂项语法

.1通配符问题

很多搜索引擎支持通配符号,如"*"代表一连串字符,""代表单个字符等.Google对通配符支持有限.它目前只可以用"*"来替代单个字符,而且包含"*"必须用""引起来.比如,""以*治国"",表示搜索第一个为"以",末两个为"治国"的四字短语,中间的"*"可以为任何字符.

.2关键字的字母大小写

Google对英文字符大小写不敏感,"GOD"和"god"搜索的结果是一样的.

.3搜索整个短语或者句子

Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格).但是,用短语做关键字,必须加英文引号,否则空格会被当作"与"操作符.

示例:搜索关于第一次世界大战的英文信息. 搜索:""worldwarI"" 结果:已向英特网搜索"worldwari".共约有937,000项查询结果,这是第1-10项.搜索用时0.06秒.

.4搜索引擎忽略的字符以及强制搜索

Google对一些网路上出现频率极高的英文单词,如"i","",""等,以及一些符号如"*","."等,作忽略处理.

示例:搜索关于起源的一些历史资料. 搜索:"的历史inter" 结果:以下的字词因为使用过于频繁,没有被列入搜索范围:的.已搜索有关的历史inter的中文(简体)网页.共约有75,100项查询结果,这是第1-10项.搜索用时0.22秒.

我们看到,搜索"的历史inter",但搜索引擎把""和"的"都省略了.于是上述搜索只搜索了"历史"和"inter".这显然不符合要求.这里我顺便说一点搜索引擎分词的知识.当我们在搜索"的历史"的时候,搜索引擎实际上把这个短语分成三部分,"","的"和"历史"分别来检索,这就是搜索引擎的分词.所以尽管你输入了连续的"的历史",但搜索引擎还是把这个短语当成三个关键字分别检索.

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的"+"号. 搜索:"++的历史inter" 结果:已搜索有关++的历史inter的中文(简体)网页.共约有25,000项查询结果,这是第1-10项.搜索用时0.05秒.

另一个强制搜索的方法是把上述的关键字用英文双引号引起来.在上例""worldwarI""中,"I"其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语.

搜索:""的历史"inter" 结果:已搜索有关"的历史"inter的中文(简体)网页.共约有7项查询结果,这是第1-6项.搜索用时0.26秒.

我们看到,这一搜索事实上把"的历史"作为完整的一个关键字.显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求.

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行.

进阶搜索

上面已经探讨了Google的一些最基础搜索语法.通常而言,这些简单的搜索语法已经能解决绝大部分问题了.不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西.

.1对搜索的网站进行限制

"site"表示搜索结果局限于某个具体网站或者网站频道,如"sina..","edu.sina..",或者是某个域名,如".",""等等.如果是要排除某网站或者域名范围内的页面,只需用"-网站/域名".

示例:搜索中文教育科研网站(edu.)上关于搜索引擎技巧的页面. 搜索:"搜索引擎技巧site:edu." 结果:已搜索有关搜索引擎技巧site:edu.的中文(简体)网页.共约有608项查询结果,这是第1-10项.搜索用时0.05秒.

示例:上着名IT门户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯. 搜索:""searchengine"tipssite:zd.ORsite:et." 结果:已在zd.内搜索有关"searchengine"tipsORsite:et.的网页.共约有1,040项查询结果,这是第1-10项.搜索用时0.09秒.

注意,在这里Google有个小BUG."已在zd.内搜索等",其实应该表述成"已在zd.和et.内搜索等".

示例:搜索新浪科技频道中关于搜索引擎技巧的信息. 搜索:"搜索引擎技巧site:tech.sina.." 结果:已在tech.sina..搜索有关搜索引擎技巧的中文(简体)网页.共约有163项查询结果,这是第1-10项.搜索用时0.07秒.

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,"site:"将被作为一个搜索的关键字.此外,网站域名不能有""前缀,也不能有任何"/"的目录后缀,网站频道则只局限于"频道名.域名"方式,而不能是"域名/频道名"方式.

.2在某一类文件中查找信息

"filetype:"是Google开发的非常强大实用的一个搜索语法.也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索.目前,Google已经能检索微软的Office文档如.xlspptdocrtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWe的.swf文档(Flash动画)等.其中最实用的文档搜索是PDF搜索.PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准.目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%.PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面.

示例:搜索几个资产负债表的Office文档. 搜索:"资产负债表filetype:docORfiletype:xlsORfiletype:ppt" 结果:已搜索有关资产负债表filetype:docORfiletype:xlsORfiletype:ppt的中文(简体)网页.共约有481项查询结果,这是第1-10项.搜索用时0.04秒.

注意,下载的Office文件可能含有宏病毒,谨慎操作.

示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档 搜索:""searchengine"tipsORtutorialfiletype:pdf" 结果:已向英特网搜索"searchengine"tipsORtutorialfiletype:pdf.共约有12,600项查询结果,这是第1-10项.搜索用时0.22秒.

我们来看其中的一个结果:

[PDF]SearchEnginesTips 文档类型:PDF/AdobeAcrobat-HTML版 ...google./press/zeitgeist.SeewhatpeoplearesearchingonatGoogle. *SearchEngineWatchsearchenginewatch./Somefreetips... allvertical./PromoKits/SearchEngineTips.pdf-类似网页

可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片.

.3搜索的关键字包含在网页标题中

"intitle"和"allintitle"的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询.网页标题,就是HTML标记语言title中之间的部分.网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中.因此,只查询标题栏,通常也可以找到高相关率的专题页面.

示例:查找日本明星藤原纪香的照片集. 搜索:"intitle:藤原纪香"写真集"" 结果:已搜索有关intitle:藤原纪香"写真集"的中文(简体)网页.共约有315项查询结果,这是第1-10项.搜索用时0.15秒.

科技文献检索学习参考参考属性评定
有关论文范文主题研究: 关于世界历史的论文范文资料 大学生适用: 硕士学位论文、学士学位论文
相关参考文献下载数量: 51 写作解决问题: 学术论文怎么写
毕业论文开题报告: 论文提纲、论文题目 职称论文适用: 技师论文、中级职称
所属大学生专业类别: 学术论文怎么写 论文题目推荐度: 经典题目

图片搜索

Google自称可以检索390,000,000张图片,并称自己为"互联网上最好用的图像搜索工具".从使用结果来看,Google的图片搜索的确不错,但个人以为比AltaVista的还是要差一些,主要体现在检索图片数量比不上,匹配度比的图片搜索器也差了些.但AltaVista国内用户无法正常访问,因此对中国用户而言,Google的图片搜索引擎已经是最好的了.

Google首页点击"图像"链接就进入了Google的图像搜索界面"images.Google.".你可以在关键字栏位内输入描述图像内容的关键字,如"britneyspears",就会搜索到大量的小甜甜布兰妮的图片.我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列.

Google给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等.点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面.屏幕右上角有一个"RemoveFrame"的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便.

Google图像搜索目前支持的语法包括基本的搜索语法如"","-","OR","site"和"filetype:".其中"filetype:"的后缀只能是几种限定的图片类似,如JPG,GIF等.

示例:查找新浪网上本拉登的图片 搜索:"拉登OR拉丹site:sina.." 结果:搜索有关拉登OR拉丹site:sina..的图片.共有6项查询结果,这是第1-6项.搜索用时0.36秒.

这里我想说明一点的是,images.google.作为专门的图片搜索引擎,实际上有其特殊的用途.

举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布于各种新闻报道中.如果用搜索图片库的方式(最容易想到的如"BenLadinphoto"),来搜索本拉登的照片,显然是不恰当的,因为很少有人专门为拉登建一个在线相册.在这个时候,images.google.就派上用场了.

但是,如果查找的图片在网上有很多主题"gallary",如诸多电影电视明星的照片,则明显就不适合用images.google.来查找了.

images.google.对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具.比如要在某个版面上插一张专题图片,用google的图片搜索功能几秒钟就可以搞定.

综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用google图片搜索,如果要搜索的图片通常是处于某个图片集合中的,则不适合用google图片搜索.

Google的其他杰出功能

.1网页快照

网页快照是Google抓下来缓存在怎么写作器上的网页.它有三个作用:

第一,如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google怎么写作器速度极快.

第二,如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过Google快照看到该页面信息.当然,快照内容不是该页最新页面.

第三,如果打开的页面信息量巨大,一下子找不到关 键 词所在位置,那么可以通过Google快照,因为快照中Google用表明关键字位置.

.2集成化的工具条

为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页就可以在工具条内输入关键字进行搜索.此外,工具条还提供了其他许多功能,如显示页面PageRank等.最方便的一点在于用户可以快捷的在Google主页,目录怎么写作,新闻组搜索,高级搜索和搜索设定之间切换.欲安装Google的工具条,可以访问"toolbar.Google./",按页面提示可以自动下载并安装.不过,Google工具条目前只支持IE5.0以上版本.

对于经常进行网络搜索者而言,Google工具条实在是必备的东西!!

.3单词英文解释

写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定.现在有了Google,一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可使用在线词典.

进入英文Google,输入你要查的单词.举个例子,我想查一下suggest的用法.结果如下:"Searchedthewebforsuggest.Results1-10ofabout8,000,000.Searchtook0.08seconds."注意看上面句子中,单词suggest下出现了一个横线,点击这个链接,就跳转到另外一个网站"dictionary./",Google已经把单词提交给该网站的查询脚本.看看这个网站所提供的详尽解释吧.:)

.4网页翻译

你懂英文,但是你不见得就懂德文,法文,拉丁文.如果搜索出来的页面是这些语言怎么办呵呵,Google提供了网页翻译功能!!虽然目前只支持有限的拉丁语,法语,西班牙语,德语和葡萄牙文,但是我不得不承认,这是个杰出功能.

试着做以下搜索:"bigbangsite:fr".这个表示查找关于宇宙大爆炸的法文网页.看第一条结果:

TheBigBangWebsite-[Translatethispage] ...AproposdeBigBang.Lederniernuméroendate.Lesanciensnuméros.Autres activités.ConcertsprogressifsenFrance.Emissionsderadio.Liens. perso.club-inter.fr/calyx/bigbang/-3k-Cached-Similarpages

有点晕.没关系,点击"Translatethispage"按钮.再看结果,嗯,大致能看明白,这原来是个叫"bigbang"的乐队的网站,与大爆炸无关...

机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内容是不可能的.但西文间的互相转译比中英文机译强得多得多了.至少能看明白.

.5单词纠错

笔者记忆力很差,英文单词经常拼写错误.但Google有纠错功能.比如在写上文的时候,我要用到英文单词"tutorial",我只是依稀记得好像是"tatorial"的样子,但不肯定,于是用Google查了一下,它马上提醒:"您要找的会不会是:tutorial",呵呵,正是这个单词.

.6繁简转换

对中文用户而言,常希望能同时检索繁体和简体信息.Google能做到这一点.Google默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索.这样省了不少力气.当然,如果你不希望这样的话,也可以在"使用偏好"中把这个选项关掉.

.7搜索结果过滤

网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱.为此,Google新设立了成人内容过滤功能,见Google的设置页面,Google./preferences,最底下有一个选项SafeSearchFiltering.不过,中文状态下的Google尚没有这个功能.


9