(2) 在百度站长论坛上官方曾表示这个标签目前对SEO的影响可以忽略不计。
<meta name ="keywords" content="这是keywords的内容">
description: 见告搜索引擎你的网站紧张内容
<meta name ="description" content="这是description的内容">
robots: 见告搜索机器人哪些页面须要索引,哪些页面不须要索引
<meta name ="robots" content="none">
author: 标注网页的作者
<meta name="author" content="广白,掘金">
(2)http-equiv属性Expires: 可以用于设定网页的到期韶光,一旦网页过期,必须到做事器上重新传输
<!-- 必须利用GMT的韶光格式 --><meta http-equiv="expires" content="Fri, 12 Jan 2001 18:18:18 GMT">
Pragma: 禁止浏览器从本地打算机的缓存中访问页面内容
<!-- --><meta http-equiv="Pragma" content="no-cache">
Refresh: 自动刷新并指向新页面
<!-- 个中的2是指勾留2秒钟后自动刷新到URL网址 --><meta http-equiv="Refresh" content="2;URL=http://www.juejin.com">
Set-Cookie: 如果网页过期,那么存盘的cookie将被删除
<!-- 必须利用GMT的韶光格式 --><meta http-equiv="Set-Cookie" content="cookievalue=xxx; expires=Friday, 10-Nov-2023 18:18:18 GMT;path=/">
Window-target: 逼迫页面在当前窗口以独立页面显
<!-- 用来防止别人在框架里调用自己的页面 --><meta http-equiv="Window-target" content="_top">
content-Type: 设定页面利用的字符集
<!-- 设定页面利用的字符集 --><meta http-equiv="content-Type" content="text/html; charset=gb2312">
(3) OG标签
它是 Facebook 在 2010 年 F8 开拓者大会公布的一种网页元信息(Meta Information)标记协议,属于 Meta Tag (Meta 标签)的范畴,是一种为社交分享而生的 Meta 标签。为了让信息内容加速流动和准确呈现,Facebook 从前极力推动这个协议,到目前险些主流的社交媒体网站都支持 OG 协议。包括 Twitter、Pinterest、LinkedIn 和 Google+ 都可以识别 OG 协议。虽然 Twitter 也有自家的 Twitter Cards 协议,但是 Twitter 只要创造网页上没有利用自家的协议,就会用 OG 协议代替。海内的百度、360 搜索、微博、微信、大家网等也支持该协议。
<html prefix="og: https://ogp.me/ns#"><head><title>The Rock (1996)</title><meta property="og:title" content="The Rock" /><meta property="og:type" content="video.movie" /><meta property="og:url" content="https://www.imdb.com/title/tt0117500/" /><meta property="og:image" content="https://ia.media-imdb.com/images/rock.jpg" />...</head>...</html>
浸染:
OG在社交媒体上具有丰富的内容展示,比如分享一个网址链接在社交平台后,这个链接会显示缩略图、标题和描述等,增加访客点进来的概率,左图加了OG标签,右图没有。

image.png
图片参考自:zhuanlan.zhihu.com/p/36072541[2] , 文章对OG先容的也挺好
标签属性可以看官网:ogp.me/[3]
3. 语义化标签H系列标签从H1到H6(主要性从高到低)一共有6个,而且在页面中的浸染性极高,以是不能乱用,得根据内容的主要性进行排列,末了不要有断层,比如从H1直接到H3,错过了H2;其余,H1标签最好只存在一个,更多细节可以网上搜下。
img标签img的alt属性,为搜索引擎供应替代文本,图片利用alt标签优化,对搜索引擎排名产生积极影响;其余,网速不佳等缘故原由造成无法加载图片文件时,将在图片的位置显示alt里的笔墨
其他还有HTML5新出的 Header, Nav,Aside,Article,Footer等语义化标签,这些都能帮助爬虫更好的获取页面内容
4. sitemap(站点舆图)站点舆图一样平常是xml格式的文件,放在网站的根目录下,有些网站乃至可以通过 网址/sitemap.xml 直接访问到(手动狗头),文件里包含了每个网页的链接(loc),更新韶光(lastmod),权重(priority)等信息,权重从0到1,依次递增,一样平常主页设为1,然后其他按主要性递减,拿掘金
005387F8.jpg
image.png
搜索引擎可以通过查看站点舆图快速获取网站的整体构造,并将精力集中在主要页面的索引上,这对付提高搜索引擎的爬行效率和索引速率非常有帮助。
5. robots文件robots.***,是一个给爬虫下指令的文本文件,能让其合理地抓取网站内资源,而且可以将网站不主要的内容、模块等进行屏蔽,从而抓取更多有代价高质量的内容和网页,提高网站排名。大多数网站都可以通过网址/robots.***进行获取, 还是拿掘金来举例:
image.png
User-agent: 后面填你要针对的搜索引擎,代表全部搜索引擎Disallow: 后面填你要禁止抓取的网站内容和文件夹,/做前缀Allow: 后面填你许可抓取的网站内容,文件夹和链接,/做前缀Crawl-delay: 后面填数字,意思是抓取延迟,小网站不建议利用Sitemap: 站点舆图的存放位置6. 内链和外链内链在自己的网站当中通过链接的办法在各个内容页面之间相互链接,从而提高爬虫以及一些搜索引擎对付网站的爬行索引效率;其余,为了避免内链起到反浸染,在进行网站待更新的时候,一定要把稳定期清理去世链和断链,方便爬虫可以顺着链接进行收录爬行,达到更好的收录效果。
外链通过在其他一些高流量的网站放置自己的链接,相较于内链的内部操作,外链可以达到网络之间的信息分享,不再让我们的网站内容形成伶仃,可以很快的增加网站的浏览数量,提升搜索排名,这对一个刚刚建立起来的新站来说,外链的数量基本上可以成为这个网站快速提升流量的关键所在,不过对付后期优化,外链的发布一定要以质量为主,数量为辅。
nofollow浸染: 超链接a标签中的一个属性(还有meta标签),意思是不向这个页面导出权重,也便是说,加上了nofollow标签的链接,目的是见告搜索引擎不要跟踪加这个链接,不要通报链接权重,不要在搜索算法中计算这个链接。通过设置nofollow标签,我们可以掌握网站权重的流动(也便是说常说的“集中权重”),避免链接指向垃圾页面,这样就可以让网站紧张的页面能够更快的得到关键词排名了。有的公司在导航上有在线留言,这个就可以加上,由于这个是没有用的,属于垃圾页面,页面会向这个页面导出权重,权重就分散了,其余还有类似广告链接等无意义的页面nofollow 和 external nofollow: 从字面上意思来看,external是“外部的”,nofollow是“不要追踪”,综合来看extenal nofollow 则表示“外部的不要追踪”,这两根本便是同一个意思,external nofollow 只是nofollow比较规范的书写而已。<a href="login.html" rel="nofollow">登录</a><a href="login.html" rel="external nofollow">登录</a>
7.数据构造化标记
构造化数据标记并不能直接帮助提高搜索排名,但它能带来很多好处:
(1)丰富搜索结果比如搜索 掘金 涌现的页面,赤色框部分便是构造化标记的成果,从框内可以更好的理解该网站的内容,而且霸占了大版面也有利于吸引用户把稳。
image.png
(2)进入知识图表进入知识图表最直接的结果便是拥有一个知识面板,该面版可供应更高的品牌有名度和威信性,如下图的右侧红框:
image.png
(3)支持语义搜索专注于搜索问题背后的含义,而不是传统的关键词匹配。当你搜索如下模糊内容时,Google 会通过这种办法设法返回得当的结果:
(4)表示E-A‑T
E‑A-T 意思 是专业(Expertise), 威信(Authoritativeness)和可信(Trustworthiness)的缩写, E-A-T是谷歌算法的一部分,并被写入谷歌搜索质量评估指南[4]中。
构造化数据形式构造化数据有三种形式:JSON-LD,Microdata和RDFa。个人之前一贯用的JSON-LD,如下:
<script type="application/ld+json">{ "@context": "https://schema.org/", "@type": "Organization", "name": "Ahrefs", "url": "https://ahrefs.com/", "description": "Ahrefs is a software company that develops online SEO tools and free educational materials for marketing professionals.", "email": "support@ahrefs.com"}</script>
Tips
这段代码可以放在<head> 或 <body> HTML 部分的任意位置,更多的JSON-LD格局可以参考Google官方[5]
8.面包屑导航见告爬虫当前所处的位置,供应抓取路径的勾引,让其更快速的理解网站的整体架构,在抓取网页时也能清楚知道网页的层级及分类索引,有助于提升搜索结果的排名。此外,设定面包屑之后,网站在搜索结果页上也会呈现网址路径,因此可以应时在面包屑的名称中加入关键词,增加用户点击率优化用户体验,让用户清楚的知道自己所在的位置,更随意马虎筛选自己须要的信息image.png
9.做事端渲染(SSR)爬虫只会爬取源码,不会实行网站的Js脚本,利用了Vue或者React之类的框架后,页面大多数DOM元素都是在客户端根据js动态天生,可供爬虫抓取剖析的内容大大减少。其余,浏览器爬虫不会等待我们的数据完成之后再去抓取我们的页面数据。做事端渲染返回给客户真个是已经获取了异步数据并实行Js脚本的终极HTML,网络爬中就可以抓取到完全页面的信息,以是就要用到SSR渲染了。
如果是项目开始的时候,就知道要做SEO,建议利用比较成熟的SSR框架
基于Vue的 Nuxtjs[6]基于Reactde Nextjs[7]如果是项目已经成形或者只想优化部分页面,建议利用一些插件来实现,比如 prerender-spa-plugin[8]、vue-server-renderer ( 适用于Vue )[9]
Tips: 爬虫不会抓取iFrame里的内容,以是只管即便避免利用
10.网站地址和产品关键词或者公司名字高度干系的域名,能够有效提升网站的SEO排名,比如下图的红框,搜索的关键词和域名地址匹配到了会高亮。各个页面的路径地址只管即便不要过长,以及不能涌现中文,否则会影响收录。由于网站改版或者其他成分,可能会涌现部分链接地址生效,这时候可以进行301重定向到新的页面,只管即便避免涌现过多的去世链(404页面),如果去世链太多,搜索引擎可能认为网站不可靠,从而影响网站的排名和流量。下面两个链接都是百度页面,像这种有多个URL为相同页面的情形,便是网址规范化问题。无论是对搜索引擎还是网站来说,多个URL为相同页面,摧残浪费蹂躏了抓取资源,而且如果多个网址内容相同时或者高度相同,可能会认为网站重复页面过多一类的成分导致影响收录乃至降权。在一个页面有多个URL时,还会对页面找出权重分散,降落了页面排名能力,网站无意义收录等问题 当页面涌现URL规范问题,搜索引擎也会自动判断并选择一个认为是规范的页面进行索引。baidu.com[10]www.baidu.com[11]办理方案:可通过在每个非规范版本的 HTML 网页的 <head> 部分中,添加一个 rel="canonical" 链接来进行指定规范网址。
<!-- href填写要作为标准的网址 --> <link rel="canonical" href="http://baidu.com">
更详细的利用可以参考 zhuanlan.zhihu.com/p/584123965[12]
11.网站性能网站打开速率越快,识别效果越好,否则爬虫会认为该网站对用户不友好,降落爬取效率,这时候就要考虑压缩文件体积之类的性能优化了。
12. 利用httpsGoogle和其他搜索引擎已经明确表示,他们更喜好利用HTTPS,由于它供应更高的安全性和更好的用户体验。当您的网站利用HTTPS时,搜索引擎会将其视为更可信和更安全的网站,从而为其排名增加积极成分。
13.提交站点收录将创建好的网站舆图提交给搜索引擎,以便搜索引擎能够更快更及时地抓取和索引网站。
百度[13]google[14]Bing[15]image.png
网站访问数据后期掩护须要一定的网站访问数据做剖析,比如流量来源,页面点击,地域分布等,不同的搜索引擎都有自己的一套剖析工具,我们只要按照官网的教程,把埋点的代码嵌入到项目即可。
百度统计[16]Google Analytics[17]附赠检测Title Tag & Meta Description优化[18]站点舆图天生[19]Web Developer[20] , 一个Chrome插件,集成了各种各样的 Web 开拓工具,比如可以利用下图红框里的选项(图1),查看网页的Title,Meta,H标签等(图2,3)。图 (1)
image.png
图 (2)
image.png
图 (3)
image.png
总结个人以为,前真个事情都是集中在项目前期,后面的话紧张是一些掩护事情,比如公司之前开拓了一个支持富文本内容的文章发布平台,然后运营部门就可以自己发一些引流的文章了,和开拓关系不大。其余,公司专门请了一个增长黑客(实在便是SEO优化工程师的角色),卖力每周给公司写文章的同学供应关键词,剖析网站访客数据,提交网站收录,探求外链资源等。