从卢亮在他的搜索引擎研究中提出了”网页信噪比“理论以后,网页信噪比已经深入人心. 最近看到在很多网页中提到的网页信噪比,其中含义是:指网页中的文本内容部分与生成这些文本而产生的html标签内容的比率。我认为这是个狭义的理解,因为搜索引擎在抓取的过程中,会考虑到各种因素,比如:网页的实际大小,对于这个问题我需要特别强调:虽然在很多的SEO著作中也提到,将flash,css封装等方法,但在网页的实际抓取过程中,并不为此为重要的依据,因为在各种链出中,还是会区分这样的指向,如果用这样的说法就不难解释有些网页以纯文本方式体现的网页和关键字词密度以及大小一样的网页在搜索引擎返回的结果高的原因.并且也能合理结实在一些搜索结果中,关联一个网站的第一页是网站的某个以文字出现的页面,而第二页才是该站的首页.
而另一个现象是,如果在页面中出现的文字和链接没有与实际内容有很大的联系,那么也会减低整体的网页信噪比,这个是在实际过程能体会到的,最真实的例子是:在一次新闻搜索中,顺迈科技的一条新闻和sohu的新闻相冲突,发布时差在5分钟左右,在第二天的搜索结果中,该网页竟然排在了sohu那条新闻的前面,顺迈科技的pr=3,sohu网站为7,新的页面都不该有pr那么,从框架上分析以后,整体是没有大的区别,那么唯一的区别是sohu新闻页面有些文字广告和一个flash广告,由此证明在页面中内容的关联率和排它率在整个网页信噪比中有非常重要意义.
所以广义的网页信噪比的概念按照我的说法应当为:网页中的文本以及各种因素(包括图片,flssh,css等链接 )和网页html标签内容的比率.
我的建议是:因当将网页信噪比做一个重要的参数指标来策划网站,因为任何因素都有可能导致SEO工作的失败,为了规避这样的风险,因当正确策划整个网站的内容和框架,大量减少图片以及FLASH的使用以及由此的封装,优化html代码.