站长基础说说之网站seo架构对网站后期推广的意义

2018-09-01 02:00:42 互联网258商务网6

核心提示：1、W3C标准对SEO的影响。　　我们看到每个网页的源文件(右键查看源文件)，几乎每个网站最顶部都有以下代码：　　以上代码是告诉

1、W3C标准对SEO的影响。
　　我们看到每个网页的源文件(右键查看源文件)，几乎每个网站最顶部都有以下代码：
　　以上代码是告诉浏览器、验证机制和搜索引擎的spider这个网站是遵循W3C标准的。
　　虽然很多网站都没有遵循W3C标准也获得了很好的排名，早在前几年，很多网站都不会遵循这个标准，但是经过验证后，能保证遵循W3C标准的网站样式不会被不同浏览器改变，使得网站的访问者看到的网页与设计出来的完全一致。http://www.yixiin.com/news/
　　2、DIV+CSS对SEO的影响。
　　DIV+CSS应该是web标准常用术语之一，在XHTML网站设计标准中，不再使用表格(table)定位技术，而采用DIV+CSS，搜索引擎对网站的排名顺序不是固定的，SEO的思想就是用搜索引擎的理念来搭建网站。
　　这种DIV+CSS设计网站对SEO的影响是显而易见的，由于结构简单、符合标准，利用DIV+CSS架构的网站深受搜索引擎喜欢，不过并不是所有DIV+CSS对网站的排名都有好处，正确的网页布局，对于SEO是非常有利的。对于XHTML标准的DIV+CSS布局，一般在设计完成后都会通过W3C验证。http://www.yixiin.com/ad/

　　3、静态页面对SEO的影响。
　　很多SEO人在做优化的过程中，可以强调页面静态化，他们认为这样更有利于搜索引擎抓取网站内容。但是，目前如google、百度等搜素引擎都能收录动态页面，使用动态页面的站点数远远大于静态页面的网站，如web2.0网站，有时候HTML静态化反而是得不偿失的。
　　其实搜索引擎对静态页面和动态页面并没有特殊喜好之分，动态页面参数机制不利于收录，同时频繁读写数据字导致磁盘损伤等等问题，而静态页面带来的问题是生成文件数量非常多，需要大量空间存储文件、同时页面维护的复杂性都将大大提高。介于此，现在很多网站流行做伪静态处理。
　　4、目录级别对SEO的影响
　　目前SEO界公认的说法是目录级别在3级以内，有时域名根目录下不一定只有目录，还有一些单页面，这样的单页面在搜索引擎中的权重肯定要比目录下的单页面高。
　　同时，在目录中设置关键词是很重要的，下面以“网站推广”这个关键词为例，“网站推广”是核心关键词，那么在设计网站结构的时候就需要把长尾关键词，如“网站推广方案”在子栏目目录名中出现，到了第三层页面就是具体要优化的三级关键词了。
　　5、目录文件名对SEO的影响
　　目录路径和文件名也是影响排名的一个重要因素，很多人很容易忽略这点，根据关键词无所不在的原则，许多重要优化的页面直接命名为文件名。目前google会将“_”、“%20”都等于空格，所以我们在做目录文件名时尽量使用乳如zblog-help.html结构，“-”而不是“_”进行分割。
　　随着搜索引擎不断改进，google、百度都能支持中文文件名了，经过使用urlencode的字符串，这样的排名要优于其他文件命名方法。
　　6、网页大小对SEO的影响
　　网页大小通常以KB来表示，早在前几年，超过100KB的网页会收录不全。可能是当时带宽也小、搜索引擎也无法抓取较大的页面。

　　如今带宽都宽了、信息量也大了，门户网站大多在100KB以上，网站大是正常的，但具体内容页面，则应该追求精简，过大的页面不仅会降低打开速度，在搜索排名中要落后于较小的页面。

　　俗话说的好，冰冻三尺非一日之寒，滴水穿石非一日之功，罗马也不是一天就建成的，当然对于我们开发人员来说，一个好的架构也不是一蹴而就的。
　　初始搭建
　　开始的开始，就是各种框架一搭，然后扔到Tomcat容器中跑就是了，这时候我们的文件，数据库，应用都在一个服务器上。

　　服务分离
　　随着系统的的上线，用户量也会逐步上升，很明显一台服务器已经满足不了系统的负载，这时候，我们就要在服务器还没有超载的时候，提前做好准备。
　　由于我们是单体架构，优化架构在短时间内是不现实的，增加机器是一个不错的选择。这时候，我们可能要把应用和数据库服务单独部署，如果有条件也可以把文件服务器单独部署。

　　反向代理

　　为了提升服务处理能力，我们在Tomcat容器前加一个代理服务器，我一般使用Nginx，当然你如果更熟悉apache也未尝不可。
　　用户的请求发送给反向代理，然后反向代理把请求转发到后端的服务器。
　　严格意义上来说，Nginx是属于web服务器，一般处理静态html、css、js请求，而Tomcat属于web容器，专门处理JSP请求，当然Tomcat也是支持html的，只是效果没Nginx好而已。
　　反向代理的优势，如下：
　　隐藏真实后端服务
　　负载均衡集群
　　高可用集群
　　缓存静态内容实现动静分离
　　安全限流
　　静态文件压缩
　　解决多个服务跨域问题
　　合并静态请求(HTTP/2.0后已经被弱化)
　　防火墙
　　SSL以及http2
　　动静分离
　　基于以上Nginx反向代理，我们还可以实现动静分离，静态请求如html、css、js等请求交给Nginx处理，动态请求分发给后端Tomcat处理。
　　Nginx 升级到1.9.5+可以开启HTTP/2.0时代，加速网站访问。
　　当然，如果公司不差钱，CDN也是一个不错的选择。
　　服务拆分
　　在这分布式微服务已经普遍流行的年代，其实我们没必要踩过多的坑，就很容易进行拆分。市面上已经有相对比较成熟的技术，比如阿里开源的Dubbo(官方明确表示已经开始维护了)，spring家族的spring cloud，当然具体如何去实施，无论是技术还是业务方面都要有很好的把控。
　　Dubbo

　　SpringCloud
　　服务发现——Netflix Eureka
　　客服端负载均衡——Netflix Ribbon
　　断路器——Netflix Hystrix
　　服务网关——Netflix Zuul
　　分布式配置——Spring Cloud Config
　　微服务与轻量级通信
　　同步通信和异步通信
　　远程调用RPC
　　REST
　　消息队列
　　持续集成部署
　　服务拆分以后，随着而来的就是持续集成部署，你可能会用到以下工具。
　　Docker、Jenkins、Git、Maven
　　图片源于网络，基本拓扑结构如下所示：

　　整个持续集成平台架构演进到如下图所示：

　　服务集群
　　Linux集群主要分成三大类( 高可用集群，负载均衡集群，科学计算集群)。其实，我们最常见的也是生产中最常接触到的就是负载均衡集群。

　　负载均衡实现
　　DNS负载均衡，一般域名注册商的dns服务器不支持，但博主用的阿里云解析已经支持
　　四层负载均衡(F5、LVS)，工作在TCP协议下
　　七层负载均衡(Nginx、haproxy)，工作在Http协议下
　　分布式session
　　大家都知道，服务一般分为有状态和无状态，而分布式sessoion就是针对有状态的服务。
　　分布式Session的几种实现方式
　　基于数据库的Session共享
　　基于resin/tomcat web容器本身的session复制机制
　　基于oscache/Redis/memcached 进行 session 共享。
　　基于cookie 进行session共享
　　分布式Session的几种管理方式
　　Session Replication 方式管理 (即session复制)
　　简介：将一台机器上的Session数据广播复制到集群中其余机器上
　　使用场景：机器较少，网络流量较小
　　优点：实现简单、配置较少、当网络中有机器Down掉时不影响用户访问
　　缺点：广播式复制到其余机器有一定廷时，带来一定网络开销
　　Session Sticky 方式管理
　　简介：即粘性Session、当用户访问集群中某台机器后，强制指定后续所有请求均落到此机器上
　　使用场景：机器数适中、对稳定性要求不是非常苛刻
　　优点：实现简单、配置方便、没有额外网络开销
　　缺点：网络中有机器Down掉时、用户Session会丢失、容易造成单点故障
　　缓存集中式管理
　　简介：将Session存入分布式缓存集群中的某台机器上，当用户访问不同节点时先从缓存中拿Session信息
　　使用场景：集群中机器数多、网络环境复杂
　　优点：可靠性好
　　缺点：实现复杂、稳定性依赖于缓存的稳定性、Session信息放入缓存时要有合理的策略写入
　　目前生产中使用到的
　　基于tomcat配置实现的MemCache缓存管理session实现(麻烦)
　　基于OsCache和shiro组播的方式实现(网络影响)
　　基于spring-session+redis实现的(最适合)
　　负载均衡策略
　　负载均衡策略的优劣及其实现的难易程度有两个关键因素：一、负载均衡算法，二、对网络系统状况的检测方式和能力。
　　1、rr 轮询调度算法。顾名思义，轮询分发请求。
　　优点：实现简单
　　缺点：不考虑每台服务器的处理能力
　　2、wrr 加权调度算法。我们给每个服务器设置权值weight，负载均衡调度器根据权值调度服务器，服务器被调用的次数跟权值成正比。
　　优点：考虑了服务器处理能力的不同
　　3、sh 原地址散列：提取用户IP，根据散列函数得出一个key，再根据静态映射表，查处对应的value，即目标服务器IP。过目标机器超负荷，则返回空。
　　4、dh 目标地址散列：同上，只是现在提取的是目标地址的IP来做哈希。
　　优点：以上两种算法的都能实现同一个用户访问同一个服务器。
　　5、lc 最少连接。优先把请求转发给连接数少的服务器。
　　优点：使得集群中各个服务器的负载更加均匀。
　　6、wlc 加权最少连接。在lc的基础上，为每台服务器加上权值。算法为：(活动连接数*256+非活动连接数)÷权重，计算出来的值小的服务器优先被选择。
　　优点：可以根据服务器的能力分配请求。
　　7、sed 最短期望延迟。其实sed跟wlc类似，区别是不考虑非活动连接数。算法为：(活动连接数+1)*256÷权重，同样计算出来的值小的服务器优先被选择。
　　8、nq 永不排队。改进的sed算法。我们想一下什么情况下才能“永不排队”，那就是服务器的连接数为0的时候，那么假如有服务器连接数为0，均衡器直接把请求转发给它，无需经过sed的计算。
　　9、LBLC 基于局部性的最少连接。均衡器根据请求的目的IP地址，找出该IP地址最近被使用的服务器，把请求转发之，若该服务器超载，最采用最少连接数算法。
　　10、LBLCR 带复制的基于局部性的最少连接。均衡器根据请求的目的IP地址，找出该IP地址最近使用的“服务器组”，注意，并不是具体某个服务器，然后采用最少连接数从该组中挑出具体的某台服务器出来，把请求转发之。若该服务器超载，那么根据最少连接数算法，在集群的非本服务器组的服务器中，找出一台服务器出来，加入本服务器组，然后把请求转发之。
　　读写分离
　　MySql主从配置，读写分离并引入中间件，开源的MyCat，阿里的DRDS都是不错的选择。
　　如果是对高可用要求比较高，但是又没有相应的技术保障，建议使用阿里云的RDS或者Redis相关数据库，省事省力又省钱。
　　全文检索
　　如果有搜索业务需求，引入solr或者elasticsearch也是一个不错的选择，不要什么都塞进关系型数据库。
　　缓存优化
　　引入缓存无非是为了减轻后端数据库服务的压力，防止其”罢工”。
　　常见的缓存服务有，Ehcache、OsCache、MemCache、Redis，当然这些都是主流经得起考验的缓存技术实现，特别是Redis已大规模运用于分布式集群服务中，并证明了自己优越的性能。
　　消息队列
　　异步通知：比如短信验证，邮件验证这些非实时反馈性的逻辑操作。

点赞 0反对 0举报 0 收藏 0 打赏 0

更多>同类资讯

推荐图文

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,258商务网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：125493959@qq.com 客服QQ：2924917661

2924917661

• 站长基础说说之搜索引擎的内外部优化你知道多少	• 站长基础说说之网站百度收录需要注意的问题
• 站长基础说说之网站改版后的降权处理方法有哪些	• 站长基础说说之新手学习优化的3大步骤
• 站长基础说说之网站如何增加网站内页收录	• 站长基础说说之seo优化应该从seo的原理上出发才
• 站长基础说说之SEO新手易走进的优化几大误区	• 站长基础说说之SEO优化如何判定一个外链的价值
• 站长基础说说之蜘蛛是如何抓取页面数据的？	• 站长基础说说之百度图片的热门目录收录规则有哪