研究人员测试了多种优化 AI 搜索的方法**,并发现了提高可见度的方法。 他们成功地将排名较低的小型**的知名度提高了 115%,使他们能够超越通常在搜索结果中占据首位的大型企业**。
来自普林斯顿大学、佐治亚理工学院、艾伦人工智能研究所和德里印度理工学院的研究人员观察到,他们的生成式引擎优化技术(称为 GEO)能够将整体可见性提高多达 40%。
在多个知识领域(例如,法律、历史、科学等)中测试了九种优化技术,他们发现了哪些有效,哪些无效,以及哪些方法实际上使排名变得更糟。
特别令人感兴趣的是,其中一些技术对特定知识领域特别有效,而其中三种技术对所有类型的**都特别有效。
研究人员强调了GEO使搜索结果顶部民主化的能力,他们写道:
“这一发现凸显了GEO作为数字空间民主化工具的潜力。困惑中的研究人员在AI搜索引擎和以Bing Chat为模型的AI搜索引擎上进行了测试,发现结果与以Bing Chat为模型的结果相似。重要的是,许多排名较低的**通常是由小型内容创作者或独立企业创建的,这些企业传统上难以与在搜索引擎结果中排名最高的大公司竞争。 ”
他们在研究的第6节中观察到**:
“我们发现,与我们的构建引擎类似,Quotation Addition 在位置调整的字数方面表现最好,比基线提高了 22%。 此外,在我们的构建引擎中表现良好的方法,如 Citations**、Stats Add,在这两个指标上都显示出高达 9% 和 37% 的高改进。 ”研究人员在他们创建的生成式搜索引擎上测试了他们的方法,该搜索引擎以Bing Chat工作流程为模型,并在AI搜索引擎Perplexity上进行了测试人工智能在上面。
他们写道:
“我们描述了一个生成引擎,其中包括多个后端生成模型和一个用于源检索的搜索引擎。研究人员从 9 个不同的**中创建了一个基准,其中包含跨多个知识领域和不同复杂程度的 10,000 个搜索查询。 例如,某些查询需要推理才能解决答案。构建引擎 (GE) 将用户查询 qu 作为输入,并返回自然语言响应 r,其中 pu 表示个性化的用户信息,例如偏好和历史记录。
生成引擎由两个关键组件组成:
a.一组生成模型 g = ,每个模型都有特定的用途,例如查询重构或汇总
b.给定查询 q 的搜索引擎 se 返回一组源 s = 。
我们提出了一个具有代表性的工作流程。 在撰写本文时,它与 Bingchat 的设计非常相似。 工作流将输入查询分解为一组更简单的查询,这些查询更有可能被搜索引擎使用。 ”
研究**解释:
“..我们策划了 geo-bench,这是一个来自多个 ** 的 10k 查询的基准测试,重新用于构建引擎以及合成查询。 该基准测试包括来自 9 个不同域的查询,每个域都根据其目标域、难度、查询意图和其他维度进一步分类。 ”下面列出了 9 个搜索查询源:
1. ms macro,研究人员测试了九种不同的优化方法,跟踪它们如何适用于不同类型的搜索,例如法律和科学、人与社会、健康、历史和其他主题。2. orcas-1
3.自然问题
4.allsouls:此数据集包含来自“牛津大学万灵学院”的测验问题。
5.Lima:包含具有挑战性的问题,这些问题不仅要求生成引擎聚合信息,还需要执行适当的操作来回答问题的推理
6. d**inci-debtate
7. perplexity.AI Discover:这些查询来自 PerplexityAI 的“发现”部分,这是趋势查询的更新列表
8.eli-5:此数据集包含来自 eli5 subreddit 的问题
9.GPT-4 生成的查询:为了补充查询分布的多样性,我们提示 GPT-4 根据查询意图(例如,导航、事务)和难度,以及生成的响应范围(例如,开放式、基于事实)从不同领域(例如,科学、历史)生成查询。
他们发现,每个利基主题对不同的优化策略反应良好。
这九种测试策略是:
权威:改变写作风格,使权威主张更有说服力。
关键字优化:从搜索查询中添加更多关键字。
添加统计信息:更改现有内容以包含统计信息而不是解释性信息。
引用(引用可靠)。
引文添加:添加引文和来自高质量**的引文。
易于理解:使内容更易于理解。
流畅度优化是为了让内容更清晰。
唯一字词:添加不太广泛使用、稀有且独特的字词,但不会改变内容的含义。
技术术语:此策略在有意义且不改变内容含义的地方添加独特的技术术语。
引用**。 搭。
统计加法。 哪种方法最有效?
排名前三的优化策略是:
引用**。 搭。
统计加法。 与基线相比,这三种策略实现了 30-40% 的相对改善。
研究人员描述了这些策略的成功:
“这些方法涉及在内容中添加统计数据,包括添加引文,并包括来自可靠来源的引用来源,对实际内容本身的更改最小。流畅度优化和易于理解的方法也有助于将可见性提高 15-30%。但是,它们显著提高了内容在构建引擎响应中的可见性,从而增强了内容的可信度和丰富性。 ”
研究人员对结果进行了解释,以显示人工智能搜索引擎如何评估内容以及如何呈现内容。
研究人员惊讶地发现,在内容中使用有说服力和权威的语气通常不会提高人工智能搜索引擎的排名,而其他方法则不是这样。
同样,在搜索查询中向内容添加更多关键字也不起作用。 事实上,关键字优化的表现比基准差 10%。
该报告的一个有趣的发现是,哪种优化效果最好取决于知识领域(法律、科学、历史等)。
他们发现,当应用“权威”优化(使用更有说服力的语言)时,与历史域名相关的内容排名更高。
引文优化通过权威引文改进内容,这些引文非常适合事实搜索查询。
添加统计数据对于法律和相关问题非常有效。 统计数据也适用于“意见”问题,搜索者询问人工智能对某事的看法。
研究人员观察到
“这表明,结合数据驱动的证据可以提高特定背景下的可见性,尤其是在这些背景下。 ”添加引文适用于人与社会、解释和历史知识等领域。 研究人员将这些结果解释为一种方式,表明也许人工智能搜索引擎更喜欢此类问题的“真实性”和“深度”。
研究人员得出结论,特定领域的优化是最好的方法。
这项研究的好消息是,通常排名较低的**将从这些针对AI搜索引擎的优化策略中受益。
他们得出的结论是:
“有趣的是,在SERP中排名较低通常很难获得知名度,但从GEO中受益明显多于从较高排名中受益**。这项研究为基于人工智能的搜索引擎提供了一条新的SEO路径。 那些说AI搜索将击败SEO的人说得太早了。 这项研究似乎表明,SEO最终将演变为GEO,以便在下一代AI搜索引擎中竞争。例如,引用来源方法显着提高了 SERP 中排名第五的 ** 的可见度 1151%,而顶部**平均下降了 303%。
…GEO 方法的应用为这些小型内容创建者提供了一个机会,可以显着提高他们在构建引擎响应中的可见性。
通过使用 GEO 来增强内容,他们可以接触到更广泛的受众,创造一个公平的竞争环境,使他们能够更有效地与数字领域的大公司竞争。 ”