Google Cloud 正在加强其分析和事务数据库,包括 BigQuery、AlloyDB 和 Spanner,旨在推动其客户 ERP 应用程序的开发。
BigQuery 是 Google Cloud 用于支持分析和 AI 工作负载的顶级数据库,它开发了多项 AI 增强功能。 首先,该公司推出了 BigQuery 和 Vertex AI 在文本和语音方面的集成预览。 谷歌云表示,这将允许用户从图像和文档等非结构化数据中提取见解。
Gemini 是该公司最大、最强大的 AI 模型,也可通过 Vertex AI 提供给 BigQuery 客户。 上周,该车型在消费市场首次亮相时表现不佳,引发了一些争议。
这些 AI 功能遵循 BigQuery 之前宣布的矢量搜索功能。 预览中的向量搜索功能支持 Genai 应用程序的关键组件,例如使用大型语言模型的相似性搜索和检索增强生成 (RAG)。
Google Cloud AI 数据分析总经理兼副总裁 Gerrit Kazmaier 表示,在 BigQuery 中直接访问 Vertex AI 可以通过多种方式为 Google Cloud AI 客户提供易用性。
Kazmaier在一份新闻稿中说:“作为数据分析从业者,你可以通过SQL命令行或BigQuery嵌入式Python API访问所有Vertex AI模型,包括我们的Gemini模型。 “这太神奇了,因为这意味着你不需要去找数据科学家或机器学习平台。 您可以在您正在处理的领域中,根据您手头的数据访问它。 ”
Kazmaier说,集成的第二个好处是更好地访问来自AI模型的数据。 在此集成之前,将数据传输到 AI 模型通常需要构建和操作以及数据管道来移动数据。 他说,不再需要了。 “所有的复杂性都消失了。 ”
在 Vertex 中结合基于文本和图像的 AI 模型的能力(现在数据分析师可以通过 BigQuery 获得)也将对客户大有裨益。
这开启了分析场景的全新阶段。 他说,对结构化和非结构化数据进行总结、提取、分类、浓缩和翻译是一件大事。 粗略地说,90%的数据是非结构化的。 此数据通常不用于企业数据分析,因为无法以有意义的方式对其进行处理。
在交易(或运营)方面,谷歌云宣布全面推出 AlloyDB AI,这是该公司在去年的 Next 23 会议上宣布的 AI 托管 Postgres 数据库的专用版本。 AlloyDB AI 存储向量嵌入和执行向量搜索功能的能力是 Google Cloud 客户 GenAI 用例的核心组件。
Google Cloud 还推出了与 Langchain 的新集成,Langchain 是一个流行的开源框架,可以帮助将客户数据连接到大型语言模型 (LLM) 中。 谷歌云总经理兼数据库副总裁安迪·古特曼斯(Andi Gutmans)表示,谷歌云的所有数据库都将与Langchain集成。
Gutmans表示,这些新功能是为了响应客户的需求,即找到一种方法从他们的数据中获得更多的GenAI价值。
该公司还宣布,它将为其云上客户托管的其他数据库(包括Redis和MySQL)添加矢量搜索功能。 Gutmans说,Cloud Spanner、Firestore和BigTable也将获得矢量功能。
Spanner 的特别之处在于它将具有最近邻搜索功能,这是一个略有不同的变体。 “真正令人兴奋的是那些拥有非常非常大的用例的客户,例如,数万亿个向量,例如基于用户的高度分区。” 可以想象,谷歌的一些内部应用程序是按用户划分的——它们将能够以万亿(向量)规模存储和搜索向量。 ”
他说:“我们的信念是,任何存储运营数据的数据库,你可能需要在genai用例中使用,也应该具有矢量功能。 “这与 15 到 20 年前将 JSON 支持添加到数据库时没有什么不同。 我们认为,一个好的向量函数应该只保留数据库的基本功能。 ”