揭秘搜索引擎中的反SEO作弊研究

搜索引擎优化简称为搜索引擎优化。其主要工作是通过了解各种搜索引擎如何抓取互联网页面、对其进行索引并确定其对特定关键词的搜索结果的排名来优化网页,从而提高搜索引擎的排名,从而增加网站的访问量,并最终提高网站的销售能力或宣传能力。

在国外,搜索引擎优化开始的比较早,那些专门从事搜索引擎优化的技术人员被谷歌称为搜索引擎优化者。由于谷歌是目前最大的搜索引擎提供商,谷歌已经成为全球搜索引擎服务商的主要研究对象。因此,谷歌的官方网站有一个专门的页面来介绍搜索引擎优化,并显示谷歌对搜索引擎优化的态度。

揭秘搜索引擎中的反SEO作弊研究 移动互联网

搜索引擎优化的出现首先是从研究搜索和黑客技术的发展中寻找漏洞。有人发现了这个会影响搜索排名的机制问题。随着世界顶级搜索引擎谷歌的快速发展,以及排名算法机制的不断更新,搜索引擎优化技术和团队近年来也得到了快速发展和壮大,越来越受到人们的重视。

首先,搜索引擎优化作弊

1。什么是seo作弊

搜索引擎作弊,或搜索引擎优化作弊,SEOSpam,搜索引擎垃圾,等等。,是指欺骗搜索引擎以提高搜索引擎的机会和排名的行为。

2。如何作弊

由于技术搜索引擎在网站排名过程中完全是由蜘蛛程序自动完成的,没有人的参与,这就为那些根据排名原则欺骗蜘蛛程序的人提供了成功的可能。在搜索引擎优化的发展过程中,一直伴随着作弊手段的讨论,这已经成为业界关注的话题。要成为一名搜索引擎优化者,你必须知道基本的作弊方法,以避免因无意中采用相关方法而受到惩罚。以下是常见的作弊方法

一)、关键词叠加。为了增加关键词的出现频率,故意在网页代码中重复写一个关键词,如META、标题、评论、图片ALT和网址。

b)错误的关键字。通过在META中设置与网站内容无关的关键词,例如在标题中设置热门关键词,我们可以误导用户进入网站。同样的情况还包括链接的关键字与实际内容不一致的情况。

c)、不可见文本/链接。为了增加关键词的出现频率,在网页中故意放置关键词密集且背景颜色相同的文本。访问者看不到它,但是搜索引擎可以找到它。类似的方法包括超小的字符和隐藏的字符层。隐藏链接基于不可见的文本,在其他页面上添加指向目标优化页面的行为。

d)重定向。使用元刷新、CGI程序、Java、JavaScript或其他技术,当用户进入页面时,他会自动快速跳转到另一个页面。重定向使搜索引擎和用户能够访问不同的网页。

e)窃取网页。也称为诱饵行为(bait-&: -switch),这是在成功注册并获得良好排名后,用与其内容无关的网页替换另一个网页的行为。

f)复制网站或内容。通过复制整个网站或部分网页内容并分配不同的域名和服务器,搜索引擎被欺骗多次索引相同的网站或页面。信息网站就是典型的例子。

g)门口页面/门页面(桥/门/入口/入口)。专门为某个关键字创建一个优化页面,链接指向或重定向到目标页面。有时,类似的方法被用来为动态页面创建静态填充,或者为不同的关键字创建不同的内部页面。然而,与门道页面不同,前者是为网站的实际内容而建立的,这是访问者所需要的,而门道页面没有实际内容,只是为搜索引擎制作了一堆充满关键词的链接。

h)、不可见页面(隐藏页面)。这意味着在同一个网站下,不同的页面内容被选择性地返回给不同的访问者。搜索引擎得到高度优化的页面内容,而用户看到不同的内容。

I)重复注册。违反网站提交纪律,突破时间间隔限制,在短时间内多次向同一搜索引擎提交网页以获得收录。

j),垃圾链接。添加“链接工厂”(也称为海量链接机制)是由大量网页交叉链接而成的网络系统。一个网站加入“链接工厂”后,它可以从系统中的所有网页获得链接,作为交换,它需要“专用”自己的链接以提高其链接分数。

第二,搜索引擎反作弊

1。为什么?有线电视引擎应该抵制作弊

至于上面提到的搜索引擎作弊行为,几乎所有的搜索引擎都反对。垃圾邮件的破坏性是巨大的。它不仅直接破坏了搜索引擎网站生存的关键,即每天数亿用户的搜索体验,也破坏了搜索引擎的主要收入来源,如竞价排名和相关广告。

搜索引擎反作弊类似于网络病毒和反病毒。因此,作为一个搜索引擎,对垃圾和作弊网站的态度也是高度一致的:惩罚或删除。几乎所有的?有线电视引擎的官方网站也公布了一些识别作弊行为的原则,并给出了相应的处罚措施。例如,2005年3月26日凌晨4点,不堪忍受的谷歌突然努力清理大量垃圾网站。(最近,备受关注的6.25和6.28百度对低质量网站进行了反作弊调整,并放弃了许多低质量和作弊网站。如果你感兴趣,你可以再看一遍“2012.8.25百度大K站谈话”。百度官方公告算法将再次升级,这将影响作弊网站的收录和低质量网站的排名。(

2。反作弊

事实上,在搜索引擎中作弊不仅损害了搜索引擎所有者的利益。从长远来看,如果网站本身的质量没有提高,但是搜索引擎作弊来吸引访问者,那么网站就不会受到用户的青睐,也就无法留住访问者,最终网站本身也会受到伤害。

虽然不可能通过技术手段完全消除搜索引擎的各种作弊行为,但可以有效地减少这些行为。解决方案如下:

一)、加强对页面内容的智能判断。对于两种作弊行为:关键词叠加和虚假关键词,应加强智能判断。例如,它是从页面的“正文”部分提取的,而不是从“或”部分提取的;判断关键词是否只在某一段重复,以消除恶意重复。对于重定向行为,应该在页面中添加重定向分析。使用刷新标签进行重定向,可以判断页面内容中的标签;使用JavaScript重定向,可以判断页面中的JavaScript代码。

网络爬虫隐身。无论是看不见的网页、窃取网页还是重定向网页,网站的当前访问者都会受到评判,从而对网络爬虫和普通用户做出不同的反应。搜索引擎应该使一些网络爬虫隐形,装扮成普通用户访问网站,并测试网站,这可以有效地防止这种类型的欺骗。

网站历史。记录网站页面变化的历史。一般来说,W站非内容部分的页面变化很小,如网站目录结构、页面结构和许多特殊连接。如果某个网站变化很大,有必要在这个网站上做进一步的检查。这样做可以杜绝偷取网页的作弊手段,提高人工审计的效率。

d)网站评级。一般来说,好网站的链接质量会很高,而一些垃圾网站的链接大多是类似的网站。换句话说,网站也通过集群生存。因此,网站可以通过评级进行分类,从而有效防止网站通过链接连接作弊。

通过以上四种方法,我们可以有效提高搜索引擎的反搜索引擎优化作弊能力,但这并不能完全消除搜索引擎优化作弊。为了提高搜索引擎的反作弊能力,有必要加入人们的行列,综合运用各种方法,并逐步进行评判?。

第一层是改进技术手段。例如,加强网页的智能分析和网络爬虫的爬行能力,增加爬虫的隐身能力。它的目的是在最底层做出反作弊的判断,判断的对象是页面,计算机执行大量的重复操作。

第二层是网络分析。通过网站历史和网站评级系统,对网站进行分析和评价。目的是筛选出合法的网站,并找出网站涉嫌作弊的搜索引擎优化。判断的对象是网站,由计算机和人进行比较和筛选。

第三个层次是最终评审。人们会尝试查看选定的可疑网站。判断的对象是网站,完全由人来完成,最后得出结论。

通过人机合作,可以基本消除搜索引擎优化中的作弊现象,搜索引擎的结果可以更好地满足访问者的需求。

第三,谷歌网页评级系统

PageRank是谷歌搜索引擎的核心软件,是由谷歌创始人开发的网页评级系统。这是谷歌搜索排名算法的一个组成部分。等级范围从1到10,10是满分。PK值越高,网页在搜索排名中的位置就越重要。也就是说,在其他条件相同的情况下,高公关价值的网站在谷歌搜索结果的排名中拥有优先权。页面级已经成为谷歌所有网络搜索工具的基础。

1。谷歌对网页级别的描述

作为一种组织和管理工具,网页级利用了互联网独特的民主特征及其巨大的链接结构。本质上,当从网页a链接到网页b时,谷歌认为a投票给了b。谷歌根据其投票来评估网页的重要性。然而,除了考虑投票的纯数量(即链接),谷歌还需要分析投票页面。重要网页投出的选票将具有更高的权重,并有助于增加其他网页的重要性。

重要的高质量网页将得到更高的网页水平。谷歌在对搜索结果进行排名时会考虑每个网页的排名。当然,如果不能满足用户的查询要求,页面级别越高,对用户来说就没有意义。因此,谷歌将网页级与完美的文本匹配技术相结合,为用户找到最重要、最有用的网页

谷歌并不关注网页上出现的关键词数量,它还对网页内容(以及链接到网页的内容)进行全面检查?确定网页是否符合用户的要求?要求。

2。PR值算法原理

公共关系值算法基于以下两个前提:

a)如果一个网页被多次引用,它可能是非常重要的;虽然一个网页没有被引用过很多次,但是如果它被一个重要的网页引用了,那也是很重要的;网页的重要性被平均地传递到它所指的网页上。这个重要的网页被称为权威网页。

b)假设用户首先随机访问网页集中的一个网页,然后跟随该网页的链接向前浏览而不向后浏览,则浏览下一个网页的概率为所浏览网页的PageRank值。

影响PR值的因素如下:

PR值是11个数值,范围从0到10,在谷歌工具栏上显示为水平的绿色条形图,在0级的情况下显示为白色。它针对的是网页而不是网站,所以一个网站的首页和内页通常有非常不同的公关价值。根据PR值的算法原理可知,影响网站(主页)PR值的因素主要有:

1.网站指南链接的质量。(一)根据上述对高质量进口链接的分析,有必要从网站获取链接,以获得较高的公关价值;增加搜索引擎分类目录;(c)与已加入目录的网站进行链接交流;从公共关系值不低于4、与用户主题相关或互补的网站获取链接;用户链接出现在流量大、受欢迎程度高和经常更新的重要网站上(如新闻来源)。在链接交换中,与用户网站的出口链接很少;链接到内容质量高的网站(公关价值有很大的上升潜力)。

2.导出链接的数量。根据PR计算的原理,由于“网页的重要性被平均地转移到它所指的网页上”,另一方面,网页中链接的过度导出会潜在地导致网页PR值的损失。然而,从内容的角度来看,适当数量的与主题相关的导出链接会给搜索引擎带来良好的印象。因此,要掌握一个页面的导出链接的数量,尤其是第一页,就要考虑到PR值和关键字内容之间的平衡,也就是说要控制导出链接的数量,最好不超过10个。

3.搜索引擎包含在网站中的页数。在讨论搜索引擎优化时,人们过于关注核心关键词的排名和主页的性能,却往往忽略了一个极其重要的问题,即搜索引擎包含在一个网站中的页面数量。后者在搜索引擎优化中也具有重要意义。由于大量网页被抓取,当用户使用其他关键词进行查询时,使用核心关键词排名不佳的网站可能会获得前三名。因为用户在搜索时使用的关键词是分散的,这种情况经常会带来很大的网站访问量。

正因为包含页面的数量直接影响访问量,它也对公关价值有很大的影响。包含的页面越多,主页的公关价值就越高。然而,应该强调的是,这里的数字指的是包含的页面数量与网站页面总数的比率,而不是包含的页面的绝对数量。然而,对于每个搜索引擎来说,这是一个很好的比例,目前还没有相关的数据。

4.主页的公共关系。虽然公关的定义是针对网页而不是网站,但由于每个网页都是依赖于某个网站而存在的,所以主页是推广的核心页面,网站主页的公关也直接影响到内页的公关。-一般来说,网站每个页面的PR值呈现以下趋势:首页>:-一级页面>:二级页面>:三级页面…每一个深度级别的PR都会降低一到两个等级。在更深层次上,人们可能不在评级范围内。当然,如果一个深层的内页有许多外部或内部链接,情况就另当别论了。

5.文件类型。谷歌可以索引的网页和文件类型包括pdf、asp、jsp、html、shtml、xml、cfin、doc、xls、ppt、rtf、wks、lwp、wri和swf。以PDF格式制作的文档通常是网站的重要内容或文章。因此,谷歌的默认PDF格式文件的PR值为3,高于一般的HTML文件。同样,谷歌给XML、PS、Woid、PowerPoint、Excel和其他类型的网页赋予了比普通网页更高的PR值。因此,建议将对网站有价值的内容制作成pdf格式。

6.更新公共关系值。谷歌每月都会进行一次彻底的数据更新。更新后,网站排名和指南链接会有一些变化,但其公关更新时间一般延迟到跳舞后三个月左右,而且网站的公关价值相对稳定,所以不容易增减公关级别。

7.公共关系价值的功能。由于网页的水平直接受到链接的影响,而链接只是搜索引擎优化的一个方面,公关水平只能反映SE0的一些影响。如果一个网页有很高的公关价值,只能说明:1)网页更重要,有排名第一的优先权,不能直接等同于排名第一;b)具有获得高质量进口环节的谈判优势;c)搜索引擎将加速网页数据的更新;d)它看起来很漂亮。

正是因为排名靠前的优先性和谈判优势,高公关的网站往往会产生高排名。业内许多人简单地将公关等同于搜索引擎优化,这不仅是不正确的,也不利于搜索引擎优化的实施。因为低PR值的网站也可能获得好的排名,而高PR值的网站可能没有理想的排名。在这种思想的指导下,人们往往片面追求链接效果,忽视了搜索引擎优化在内容、结构、关键词等方面的分析和改进。,这是用户和搜索引擎长期关注的焦点。互联网营销人员认为,公关价值应该是搜索引擎营销(包括搜索引擎优化)的自然结果,而不应作为一个目标来追求。

对于搜索引擎优化,各大搜索引擎的态度是不同的,有的不表达自己的观点,有的则公开支持。应鼓励合法的搜索引擎优化,这可以为搜索引擎提供更准确的网站索引。在搜索引擎优化中作弊被所有主要搜索引擎拒绝,并被处以各种处罚。要完全消除搜索引擎排名中的作弊是不可能的,一个成功的搜索引擎应该尽量避免索引垃圾页面。为了实现这个目标,我们必须从域名分析到页面内容的提取,从网站的历史行为到最新页面状态的检索?。诚然,主要搜索引擎的反作弊策略才刚刚开始。

来源:马博客

为您推荐

发表评论

电子邮件地址不会被公开。