营销知识
您的位置:主页 > 营销知识 >

【狗小云】引擎算法研究2(隐含语义索引原理)

网站编辑:红莲 │ 发表时间:2012-06-12 15:57 | 文章标签:

成功实现,无限接近,模拟百度隐含语义索引原理技术 -
承接单一站点引擎算法报告制作,  (可以校政站内关键词用)
对某个词汇,所有互联网中文页面(掌握百度关键词流行度,和距离最近的一些词汇,能分析出,所有相关词,距离主词汇的权重距离,那个相关词最近,就部署到重要导航上,以此类推,掌握权重该分配多少,提供了重要的参考,然后进行部署站内,保证不靠链接,就靠对应部署与百度契合度最高的词汇,就能排名首页)
 
 QQ:455873983   速度++ 保留QQ   难道你以后用不到?人快加满了哦
 

 
 
   以前只知道语义索引的理论,终于可以应用于实战了,其重要程度,堪称掌握了一门预测未来的能力,整个互联网,包含了人类对一些事物所有的情感,如宣泄,不满,开心,等等,如果美国选举总统,把所有关总统的,文字页面,抓到服务器下去运算,看围绕那个总统候选人的,词汇多,
负面词语多,还是正面词汇多,最后就能得出谁的支持率高,你就提前知道了谁会选举胜出,难道这不是预测未来的能力吗?利用在股票和风险投资上,岂不立于不败之地?
 

 
   如果我对整个58同城网站,进行一个月的绘制,就你就会看到一个宛如宇宙的星图,主站延伸,每个分站如放射性的小星系一样,漂亮至极,有机会,花一个月时间绘制一次。
 
 
制作-关键词罗盘阵列图---筛选过滤掉900个,这个坑的最低点,就是我的核心关键词。

 
 
   下面文章引用于网络,写的非常清晰了,我就不重新写了,
 
重点演示模拟百度隐含语义,引导站长告别低端SEO,告别搞链接的农民苦海,进入高端SEO行列,不靠外链照样能排名。
 
 
1、隐含语义索引原理的作用
  隐含语义索引原理主要是解决文章内容标题。包括下面几个方面:
  ①、内容的重双标题
  ②、要害词的相关标题
  ③、要害词的密度标题
  ④、要害词堆砌标题
  ⑤、文章原创标题

2、要害词密度标题
  我们学习SEO卖前经常正在考虑,搜索引擎是怎样断定我们的文章能否原创的呢?怎样断定我们一篇文章是质量高还是质量低的呢?怎样样可以晓得我的文章有没有要害词集合?怎样样可以晓得我的文章中的要害词密度。
  这个隐含语义索引原理就是如今主流搜索引擎用的一个核心的索引原理。它是基于中文分词原理来的。我们前面的课程中有具体的讲过中文分词原理。
  中文分词原理就是说,搜索引擎假如要经过上千万亿个网页走断定某个要害词的要害词排名,并且计算它的排名的话,是非常非常困难的。不可能像如今这样,正在零点零几秒就可以计算出一个结果出来。汉语的词汇量,一共只要8万条。经过语义索引,把上千万亿个网页决裂成了8万条词条上面,就使得计算变得非常的简略了。使得计算从一个很双杂的、非常庞大的数字,酿成一个计算机可以人为控制的数字了,仅仅只要8万条。
  搜索引擎的蜘蛛把一个页面里的代、文字全都下载下来之后,它会进行分析。把这个页面里面一切的中文字词整理出来,进行切割。这个切割的过程就是分词,把页面内容分成若干个不可再分的词。然后把一些过路词走失。什么是过路词呢?这个、那个、正在、的……等等等等,这些要害词是没存心义的词。只留下一些名词、动词、描述词。
  把一个页面分化成这些词卖前,就开端统计每个词出现的次数和频次。这样搜索引擎就晓得了你的要害词正在页面出现了几次,也就算出了要害词密度。

3、要害词堆砌标题
  搜索引擎晓得了你的要害词正在页面出现了几次,也晓得了跟它相关的词又正在页面出现了几次。比如你一个词出现了100次,它的相关词只出现了2次,搜索引擎就晓得你肯定是正在堆砌要害词,是正在作弊。
  所以说,有没有要害词堆砌,这是可以算出来的。并且差别的行业差别的词,它们的比率是不一样的。这就解决了要害词堆砌的标题。

4、相关要害词标题
  相关要害词它的比率到底是几多呢?比如说SEO培训,“SEO”出现的次数,和“SEO培训”出现的次数,他们的比率是几多。再比如上海不锈钢,“上海”出现的次数,和“上海不锈钢”出现的次数,他们的比率又是几多。这个别家是可以算出来的。
  你正在一篇不相关的文章插进一个要害词。比如网站上面基础没讲SEO,你插一个“SEO”正在里面。这个时分“SEO”可能就会起反作用。由于它经过隐含索引原理,可以计算出来,你这个要害词跟你这个页面不相关。

  
7、隐含语义索引原理的引申考虑
  关于隐含语义索引原理,我们可以考虑两个标题。
  1、维持页面上要害词的最新相关。
  差别的时期内,一个要害词的相关要害词是差别的。我们要连续调解我们的页面内容,使我们页面上的要害词维持最新的相关。这样搜索引擎就会连续觉得我们这个网站是有价值的。
  2、钻研那些外部链接相比少,而要害字排名相比靠前的网页。这些页面,阐明百度对他的内容质量是打了高分的。
 
 
 
 
 
 
 
 
提取密度词汇,1000个 (是已经分析好密度,分析到语义相关的) 带入到3D软件里,做3D演示 关键词阵列图
 
 
 
 
 

 
 
 
 
 母婴网站站内分析 
 
 
   
 
第一轮过滤筛选  
 

 

 罗盘筛选
 

 
 主词关连性筛选
 

 
 
 第2轮筛选

 
 罗盘筛选
 

 
 主词汇关联筛选
 

 
 
 最终结果

 

 
 
 
医院网站,站内分析,
 

 
 
 
统计以上,密度词汇,互相组合使用的次数,组成语义索引 关键词 阵列
 

 

 
 
制作关键词,阵列罗盘
 
 
这是组合使用次数,最高的几个关键词
 

 
 
继续统计,计算相关性
 

 
最后得出站内相关性最强的几个 关键词组合,   
我们看到,他网站内的,算法解释出的,词汇组合,根本 与 百度的贴合度不够, 这个时候,就需要调整了  
 
 

 

 
 
 

扫描二维码分享到微信

在线咨询
联系电话

15929322171