人们说LSI关键字可以提升Google排名。这是真的,还是SEO的另一个谬论?阅读几乎所有有关LSI关键字的文章,都会告诉您两件事:
Google使用一种称为LSI的技术来索引网页。
在内容中使用LSI关键字有助于您在Google上排名更高。
从技术上讲,这两种说法都是错误的。在本指南中,您将了解为什么会这样以及如何处理。我们首先需要对LSI本身有更多的了解。
文章目录
LSI关键字是什么?
LSI(Latent Semantic Indexing)即我们常说的潜在语义索引,与LSA(Latent Semantic Analysis)潜在语义分析一样,是1980年代开发的一种自然语言处理技术。LSI关键字是Google认为与某个主题在语义上相关的单词和短语,至少根据SEO社区中的许多人而言。例如,如果您谈论的是汽车,那么LSI关键字可能是汽车,发动机,道路,轮胎,车辆和自动变速箱。
什么是同义词?
同义词是指与另一个单词或短语相同或几乎相同的事物的单词或短语。根据LSI,人们用来描述同一对象或概念的词语有很多不同之处,这称为同义词。处于不同上下文或具有不同需求,知识或语言习惯的用户将使用不同的术语描述相同的信息。但这与搜索引擎有何关系?
想象一下,我们有两个关于汽车的网页。两者是相同的,但是用“ car”一词的所有实例代替“ cars”。如果我们要使用仅对页面上的单词和短语编制索引的原始搜索引擎,则它将仅对查询“cars”返回这些页面之一。这只是以一种不同的方式描述了我们正在寻找的东西。使用“automobile”一词代替“cars”一词的页面甚至可能是更好的结果。因此,搜索引擎需要了解同义词才能返回最佳结果。
什么是多义词?
多义词和短语是具有多种不同含义的词和短语。例如包括mouse(老鼠/鼠标),bank(金融机构/河岸)和bright(灯光/智能)。LSI的创建者认为,在不同的上下文中或由不同的人使用时,同一个词具有不同的参照意义(例如,河岸的“bank”与储蓄银行的“bank”)。因此,在搜索查询中使用术语不一定意味着包含相同术语或由相同术语标记的文本对象是令人感兴趣的。这些词给搜索引擎带来了与同义词相似的问题。例如,假设我们搜索“苹果电脑”。我们的原始搜索引擎可能会返回这两个页面,即使显然不是我们想要的页面:
因此,不了解多义词的不同含义的搜索引擎可能会返回不相关的结果。
LSI如何工作?
电脑很笨。他们没有人类所固有的对单词关系的理解。例如,每个人都知道 big 和large意味着同一件事。每个人都知道John Lennon在甲壳虫乐队中。但是计算机没有被告知就不具备这些知识。问题在于无法将所有内容告诉计算机。因此,这将花费太多时间和精力。LSI通过使用复杂的数学公式从一组文档中得出单词和短语之间的关系来解决此问题。鉴于LSI解决的问题,我们很容易理解为什么人们认为Google使用LSI技术。毕竟,很明显,匹配精确的查询是搜索引擎返回相关文档的不可靠方法。但是尽管如此,Google几乎可以肯定不使用LSI技术。我们怎么知道?Google代表这样说:
1. LSI是旧技术
LSI于1980年代发明,然后才创建了全世界。因此,从来没有打算将其变成如此大量的文档。因此,谷歌开发了更好的,引入可扩展性的技术来解决相同的问题。LSI技术并非针对任何规模的Web,Google开发了一种词向量方法(用于Rankbrain),该方法更加现代,可扩展性更好并且可以在Web上运行。在可以使用Word2vec的情况下使用LSI就像用购物车竞速法拉利。
2. 创建了LSI以索引已知的文档集合
地球不仅庞大而且动态。这意味着Google索引中的数十亿页面会定期更改。这是一个问题,因为LSI告诉我们,分析需要“每次在存储文件中进行重大更新时都运行”。这将需要大量处理能力。
3. LSI是一项专利技术
潜在的语义索引(LSI)专利于1989年授予Bell Communications Research. Inc.。从事这种技术的共同发明人之一苏珊·杜迈斯(Susan Dumais)后来于1997年加入微软,从事与搜索相关的创新。也就是说,美国专利在20年后到期,这意味着LSI专利在2008年到期。考虑到Google非常优秀的长理解语言并比2008年早些时候返回了相关结果,因此这又是另一条证据,表明Google不使用LSI。
Google确实尝试索引单词的名词和其他含义。但是它并没有使用LSI技术来做到这一点。称其为LSI会误导人们。Google至少从2003年起就开始提供名词替换和基于名词的查询优化,根本并不意味着它们使用LSI。就像您正在使用智能电报设备连接到移动网络一样。
提及相关的单词,短语和实体可以提高排名吗?
大多数SEO都将“ LSI关键字”视为相关的单词,短语和实体。如果我们遵循该定义(尽管在技术上不准确),那么可以,在内容中使用一些相关的单词和短语几乎可以肯定有助于改善SEO。Google在这里间接告诉我们:
试想一下,当您搜索“狗”时,您可能不希望页面上多次出现“狗”字样。考虑到这一点,算法会评估网页是否包含除关键字“狗”之外的其他相关内容,例如狗的图片,视频或什至品种列表。在关于狗的页面上,Google认为各个品种的名称在语义上相关。
为什么要对这些帮助页面的相关术语进行排名呢?
很简单,因为它们可以帮助Google了解页面的整体主题。例如,以下是两个页面,每个页面都提到“狗”一词的次数相同:
查看每页上的其他重要单词和短语,可以告诉我们只有第一个与狗有关。第二个主要是关于猫的。Google使用此信息对相关查询的相关页面进行排名。
如何查找和使用相关的单词和短语?
如果您了解某个主题,那么您自然会在内容中包含相关的单词和短语。例如,要写出最好的视频游戏而又不提“ PS4游戏”,“使命召唤”和“辐射”之类的单词和短语就很难。但是容易错过重要的主题,尤其是涉及更复杂的主题。
Google可能将这些视为重要的语义相关术语,任何有关该主题的好文章都应提及。这可能是谈论这些事情的文章胜过我们的原因的一部分。考虑到这一点,这里有九种方法来查找可能相关的单词,短语和实体:
1. 使用常识
检查您的页面,看看是否有任何遗漏之处。例如,如果该页面是关于唐纳德·特朗普的传记文章,但没有提及他的弹劾,则可能值得添加有关这一部分的内容。这样一来,您自然会提到相关的单词,词组和诸如“穆勒报告”,“南希·佩洛西”和“举报人”之类的实体。请记住,我们无法确定Google是否将这些单词和短语视为与语义相关。但是,由于Google旨在了解人类固有理解的单词与实体之间的关系,因此使用常识需要说些什么。
2. 查看自动完成结果
自动完成搜索结果并不总是显示重要的相关关键字,但是它们可以为可能值得一提的关键字提供线索。例如,我们将“唐纳德·特朗普配偶”,“唐纳德·特朗普年龄”和“唐纳德·特朗普推特”视为“唐纳德·特朗普”的自动填充结果。它们本身并不是相关的关键字,但是它们所指的人物和事物可能是相关的。在这种情况下,他们是73岁的梅拉尼娅·特朗普(Melania Trump)和@realDonaldTrump。
3. 查看相关搜索
相关搜索显示在搜索结果的底部。就像自动完成结果一样,它们可以提供有关潜在相关的单词,短语和值得提及的实体的线索。在这里,“唐纳德·特朗普教育”可能是指他参加的宾夕法尼亚大学沃顿商学院。
4. 使用“ LSI关键字”工具
流行的“ LSI关键字”生成器与LSI无关。但是,他们偶尔会反驳一些有用的想法。例如,如果我们将“唐纳德·特朗普”插入流行的工具中,它将吸引相关人士(实体),例如其配偶梅拉尼娅·特朗普和儿子巴伦·特朗普。
5. 查看排名靠前的其他关键字
使用Ahrefs的关键字资源管理器中的“也为……排名”关键字提示报告,以查找可能相关的单词,词组和实体。如果要处理的内容太多,请尝试使用排名靠前的三个页面运行内容差距分析,然后将相交数设置为“ 3”。这将显示所有页面都排名的关键字,通常可以为您提供更详尽的相关单词和短语列表。
6. 运行TF * IDF分析
TF-IDF与潜在语义索引(LSI)或潜在语义分析(LSA)没有关系,但是它有时可以帮助发现“缺失的”单词,短语和实体。
7. 看知识库
Wikidata.org和Wikipedia等知识库是相关术语的绝佳来源。Google还从这两个知识库中提取知识图数据。
8. 对知识图进行逆向工程
Google将许多人,事物和概念之间的关系存储在称为知识图的事物中。知识图的结果通常显示在Google搜索结果中。尝试搜索您的关键字,看看知识图中是否显示任何数据。因为这些是Google与该主题相关联的实体和数据点,所以绝对值得在有意义的地方讨论相关的实体和数据点。
9. 使用Google的自然语言API查找实体
将排名靠前的页面中的文本粘贴到Google的自然语言API演示中。寻找您可能错过的相关且可能重要的实体。
LSI关键字不存在,但与语义相关的单词,词组和实体却存在,它们可以提高排名。只要确保在合理的地方使用它们,不要随意在任何地方和任何地方洒它们。在某些情况下,这可能意味着向页面添加新的部分。例如,如果您想在有关唐纳德·特朗普的文章中添加“弹劾”和“众议院情报委员会”之类的词语和实体,则可能需要在新的小标题下添加几个新段落。