搜索技巧
善用关键词规则
通用关键词规则1
- 通过双引号要求搜索结果必须包含双引号中的内容,例如:
optimal transport lccurious
,要求搜索引擎必须按照双引号中的短语顺序检索结果; - 使用减号排除包含减号后的搜索结果,例如:
transformer -csdn
,就可以排除掉搜索结果中所有与csdn相关的条目了; - 使用
site
关键词让返回的条目只包括在某个指定站点的内容,例如:latex site:github.io
,让返回条目中只包含在“github.io”站点下的内容; - 使用
link
关键词让返回的条目内容中都包含链接了指定的网站,例如:link:github.com
,过滤掉那些不包含“github.com”这个链接的条目,需要注意的是只要网页源代码里有指向该链接的条目都会被视为符合规则(即使页面上肉眼不可见); - 通配符检索用
*
充当一个占位符,过滤出仅*
位置位置不同的组合内容搜索结果,例如"The most genius * in the world”
,就可以过滤出所有世界上最天才的xxx的搜索结果; - 近似含义说明符号
~
,例如:happy ~dog
; - 使用
related
关键词搜索所有内容相关或者类似的网站,例如:related:dribbble.com
就可以直接搜索到与这个素材网站相似的其他网站; - 计算一些简单的数学内容,例如:
exp(10)+sin(10)
; - 快速换算单位,例如:
100日元=?人民币
; - 使用
define
关键词搜索定义,例如:define:normal
、define:沁园春
; - 使用
AND
、OR
等进行组合搜索,Google搜索默认情况下都是使用AND逻辑,即所有关键词都命中的结果才会被返回,但是也可以手动改用OR的逻辑,例如:transfer learning OR domain adaptation
; - 搜索包括指定数字范围内的内容,例如:
causal discovery 2020..2022
就会大概返回2020年到2022年之间的文章; - 使用
filetype
关键词,例如:cpi ppi 差 filetype:pdf
基本上返回的都是与CPI、PPI指数相关的研报PDF文件等; - 使用
inurl
关键字,例如:inurl:mp4 “瑞克和莫蒂”
,在所有返回结果中,网页链接中包含第一个关键字mp3
,第二个关键字瑞克和莫蒂
出现在链接中或网页文档中; - 使用
allinurl
关键字,例如:allinurl:”cgi-bin” phf +com
,让返回的网页链接中包含所有关键字; - 使用
intitle
、allintitle
关键字对标题栏(即网页标签页名字)进行搜索,例如:intitle:😧
就可以搜索所有标签页带这个表情的页面了; - 同理还存在
inanchor
、allinanchor
这类关键字; - 使用
cache
关键词可以在Google的缓存页面上进行查询;
Google学术搜索
- 使用
author
关键词限定作者如author:"Kun Zhang" AND intitle:"Causal"
; - 使用
source
关键词指定来源,与site
类似,有时site
范围太广,使用source
更精确。 如"kernel method" source:"Advances in Neural Information Processing"
,搜索nips
包含kernel method
全部论文; - 使用
intext
关键词,例如:intext:("kernel method" -"semi-supervised learning")
,搜索内容中包含kernel mehtod
且不包含semi-supervised learning
的论文; - 对于某网址对应多个期刊的情况,使用
source
而不是site
进行界定。如TPAMI对应网址ieee.org
有很多期刊,而其对应来源为IEEE Transactions on Pattern Analysis and Machine Intelligence
;
下面是一些常用的机器学习相关的源2:
机器学习领域顶会网址(site)
刊物缩写 | 网址site |
---|---|
nips | nips.cc |
icml | icml.cc |
jmlr | jmlr.org |
ijcai | ijcai.org |
aaai | aaai.org |
uai | uai.org |
ML汇刊 | proceedings.mlr.press |
Springer下刊物 | link.springer.com |
IEEE下刊物 | ieeexplore.ieee.org |
机器学习领域顶会来源(source)
刊物缩写 | 刊物source |
---|---|
AI | Artificial Intelligence |
TPAMI | IEEE Transactions on Pattern Analysis and Machine Intelligence |
JMLR | Journal of Machine Learning Research |
TNNLS | IEEE Transactions on Neural Networks and learning systems |
Cybernetics | IEEE Transactions on Cybernetics |
NIPS | Advances in Neural Information Processing Systems |
ICML | International Conference on Machine Learning |
IJCAI | International Joint Conference on Artificial Intelligence |
AAAI | AAAI Conference on Artificial Intelligence |
COLT | Annual Conference on Computational Learning Theory |
UAI | Conference on Uncertainty in Artificial Intelligence |
一些语义上的搜索技巧
- 尽量使用简洁的关键词,因为描述内容越详细满足要求的搜索结果就会越少就越不容易找到对应的内容;
- 逐步增加关键词,根据搜索结果调整增加的关键词;
- 使用一些主动语态的词,例如“如何减轻头痛”改为“缓解 头痛”;
- 同时搜索近义词,比如
高等教育
,学院
;
还可以在日常的使用过程中,根据自己的经验积累一些有好资源的网站,之后一些专业性较强的问题的可以优先在那些网站上搜索。
其他引擎
常用数据源3
书籍下载
- Library Genesis
- 英文文献:推荐 CROSSREF 数据库),最后使用 Sci-Hub 数据库下载。
- Sci-Hub 可用网址 1,可用网址 2。或者使用 Sci-Hub 桌面客户端:SciHub Desktop,Sci-Hub EVA 。(四款桌面客户端软件性能评测)
- ScienceHuβ,The National Academies Press,Open Access Theses and Dissertations
- 英文书籍搜索推荐引擎:Jiumo E-Book Search 鸠摩搜书,Library Genesis,BookFi,Electronic library,booksc.org,AvaxHome,ebookhunter,bookrix,Free ebooks - Project Gutenberg,FreeBookSpot ,hathitrust,PDF Drive,PDF search engine
- 中文书籍搜索推荐引擎
- Jiumo E-Book Search 鸠摩搜书
- 全国图书馆参考咨询联盟 :推荐使用 ISBN 检索,通过脚本一键获取图书进行购买,
- 需要图书馆权限:读秀学术搜索,超星汇雅电子图书数据库
- 中文 PDF 搜索引擎
- IDEAS the largest bibliographic database dedicated to Economics and available freely on the Internet. Based on RePEc, it indexes over 2,400,000 items of research, including over 2,200,000 that can be downloaded in full text.
- 电子书:Free eBook PDF EPUB Download,电子书免费下载,SoBooks(原 “SoKindle”),电子书网站汇总
扩展技巧
从谷歌搜获更多
Hacking Google search
Offensive Security’s Exploit Database Archive
Google Hacking for Penetration Testers
Enjoy Reading This Article?
Here are some more articles you might like to read next: