大型网站SEO之精准可控内链管理系统

早期SEO是个简单粗暴的行业,作弊与人海战术就可以致胜。但当下随着算法的完善和用户体验等因素,SEO屹然是一个成熟细分支学科,需要科学化,系统化的进行规划与操作。我们今天就以内链作为一个切入口进行分享。

 

大型网站SEO之精准可控内链管理系统

 

任何一家稍有规模的网站都会希望利用SEO技术发挥网站的规模优势,获得更多低成本流量,但目前主流的思路还是以创建更多页面,覆盖更多关键词为主。而内链部分的dafa8888相对投入较少,潜力也未被较好的开发。

 

绝大部分的内链dafa8888是基于两个方法,一是人工手动调整内链资源集中于少量重要页面;二是通过SQL匹配关键词或随机输出内链匹配。

 

以上两种方法都无法实现一个核心目标:大规模高质量自动匹配。为了避免过于形容化的辞令让大家产生模糊,让我们来界定几个目标:

 

  • 大规模——至少覆盖网站全部页面资源90%以上
  • 高质量——这里判别质量的核心要素是页面之间的相关度
  • 自动匹配——利用我们配置过的调度算法进行相应的匹配,避免大量人力操作

 

网站内链精细可控目标

网站内链精细可控目标

 

关于如何实现大规模内链

 

SEO从业者往往做着创建几万,几十万新页面的计划,但很少知道自己的网站到底有多少页面。但当我们要充分发挥网站规模优势的时候,必须尽可能多的调动所有可用页面资源,此时对所有页面进行统一的编号存储在数据库中就是势在必行的基础工作了。

 

为什么要把所有页面统一编号管理?

 

因为后面我们要逐一的判断页面之间的相关度,从而精准的进行匹配而后形成内链结构,没有这些数据,我们无法进行精确的匹配和管理。

 

怎么才能获得所有页面呢?这里我们可以采用一种复合方法:

 

第一步、采用全站抓取采集的方法建立一个基本库。但是这里会遇到一些障碍,诸如死链,孤岛页(没有导入导出链接的页面),死循环等,不但耗时而且会遗漏很多页面。

 

第二步、直接模拟URL生成规则与数据库内容量输出URL清单(模拟URL生成规则:动态页面会使用一个模板,根据URL中的不同参数值,输出不同的页面内容,而参数的数值通常是内容保存在数据库中的一个索引编号。所以把数据库内的所有内容的编号,依次生成URL,最后形成一个列表清单。就会比较全面的覆盖所有页面。)

 

这样做的一个附带好处是,你可以发现很多页面是无法通过蜘蛛爬行出来的,也就是很难被搜索引擎的爬虫发现,如果能给这也无法被搜索引擎爬虫发现的页面提供相应的入口就可以增加有效收录。

 

关于高质量内链

 

视角,寻找最佳链接

 

视角,寻找最佳链接

 

高质量链接也就是目标页面和站内最相关页面之间建立链接,页面与页面之间的相关度我们如何判别?其实这是一个伪命题,因为页面与页面的相关度如果没有一个明确的可以量化的前提,就无法给出一个有效的答案。而这个可以量化的一个准则就是关键词

 

也就是说,针对某一个关键词而言,页面与页面的相关度才是有意义的。那么怎么才能知道目标页面针对某个关键词的量化相关度是多少?我给不出数字性的答案,但可以给出一个被黑盒化的结果。那就是搜索关键词时站内页面的排序顺序

 

我们可以使用site命令,例如 找目标页面的关键词 “人力资源培训” 最相关的页面,方法就是在搜索引擎中输入命令: site:www.***.com 人力资源培训 , 搜索结果的排序顺序就是站内所有页面和人力资源培训这个关键词相关度由高到低的排序。

 

site 命令应用举例

site 命令应用举例

 

第一个出现的页面肯定是相对最相关的,以此类推,就可以得到一批“精准”的高相关度页面,然后我们把这些高度相关页面都用关键词“人力资源培训”指向目标页面。

 

但是最关键的问题来了,你如何管理几万,几百万的页面与不同关键字之间的排序结果呢?很显然,这就是需要建立在上一个小章节“如何实现大规模”的基础之上。

 

每个URL都有一个唯一ID,而每一个关键词也有一个唯一ID,那么这两个ID加上一个排序结果,就可以妥善的储存“页面与页面”高质量(相关度)的黑盒结果了。当我们手里有了这样一个高质量的数据后,就可以实现自动匹配的目标了。

 

关于内链自动匹配

 

这里的难点不在于数据之间的匹配,而在于合理的匹配。什么是合理?什么是不合理呢?判断的一个标准是,匹配后的页面内链输出是要提高页面的SEO竞争力,而非降低或干扰。让我们用两个案例来更清晰的做一个描述吧。

 

案例一:如果一个为Hi的页面在A关键词的结果中排名第一,而我们提供了很多在B关键词结果中排名靠前的页面反链给Hi页面,并且A和B不是相关词,是完全不同的两个词,那么这个时候,我们所提供的内链就对Hi页面的A关键词排名造成了干扰。

 

案例二:如果我们有一个新页面Baby,专门用于A关键词的排名,但是我们提供了几百个非相关词的内链,这也会造成很大干扰。

 

让我们在百度搜索“首页”就可以知道这两个案例的用意了,排名靠前的网站是因为站内很多页面用“首页”这个词指向网站的首页,导致网站首页真正要做的关键词的排名受到干扰,“首页”这个不相关的词排名提高。

 

所以我们的内链的自动匹配,一定要在算法上尽可能的排除掉非高度相关的页面的内链生成。单纯的聚合页面就又成为了简单粗暴地SQL式内链(TITLE或内容中出现一次Keyword不代表是高度相关的)。

 

而这里面具体的策略设定,需要根据每个网站资源的不同而适度调整。如果词量很少,那么策略就很简单,尽可能的全站内链(修改网页模板代码,令几乎所有页面都带有一个指向某个页面的反向链接)。

 

如果你有大量关键词和指定着陆页需要精准的维护,就需要将资源做一个优先调整。例如:如果你有1000个页面都和A,B两个关键词高度相关,但你的A词排名很理想,B词却N页开外,这时你就需要把这1000个页面内链资源优先分配给B关键词的指定着陆页进行加强。

 

这套内链系统实际运用和搭建要比我们上文中描述的复杂很多,由于篇幅有限不能完整详细列出,但原理就是如此。(下面几张图是完整系统数据库存储结构)

 

内链系统数据库结构图

内链系统数据库结构图

 

数据库存储结构——词表

数据库存储结构——词表

 

数据库存储结构——页面表

数据库存储结构——页面表

 

数据库存储结构——入口页面表

数据库存储结构——入口页面表

 

数据库存储结构——导出页直接到目标页内链表

数据库存储结构——导出页直接到目标页内链表

 

数据库存储结构——导出页直接到目标页内链表

数据库存储结构——导出页直接到目标页内链表

 

数据库存储结构——多个页面之间连接内链表

数据库存储结构——多个页面之间连接内链表

 

在这个系统中还可以扩展出一个很有意义的功能,那就是关键词与着陆页的绑定。很多SEOdafa8888人员采用广撒网的方式,获得排名,但很多时候有排名的页面,并非最佳着陆页,导致用户转化率很低。

 

但是一旦明确了某个页面竞争某个关键词,又会导致资源调动上的难以管理,尤其是当你有成千上万关键词的时候(用excel管理几千个keyword的详细规划,是很痛苦和低效的事情,更何况几万以上)。

 

综上所述,做好SEO尤其是大站SEO,必须建立在高度精细化的数据管理之上,策略与执行的延续不应受到负责人变更的影响而中断或调整。如何搭建一套成熟可控的系统,是一个具有长远价值的事情,虽然过程中遇到很多困难。

本文欢迎转载:北京SEO » 大型网站SEO之精准可控内链管理系统

赞 (0)

评论 1

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. 我赚啦抱着学习的态度来看看回复
<友情连结> 探索者SEO顾问团队/ 上海翼好SEOdafa8888公司/ 雨中漫步网络/ Zhejiang GBF Basalt Fiber Co., LTD./ Ekoloski pokret/