以下是本周为您精选的有关自然语言处理 (NLP) 和人工智能 (AI) 的文章、指南和新闻!
网络新闻
通过深习发现了数百万种新材料。 Deepmind 的 GNOME 由图神经网络 (GNN) 提供支持,已成功稳定了数千种新材料,其中包括由外部研究人员创建的 736 种结构。 受已知晶体结构和化学式的启发,GNOME 的输入连接对于探索新的晶体材料特别有用。
投资者敦促首席执行官辞职,Stability AI考虑**。 英国人工智能初创公司Stability AI正在考虑**,以应对投资者对其财务稳定性和业绩的压力。 投资者 Cotue 建议首席执行官做出必要的改变,以改善公司的经济状况。
ChatGPT的训练数据可以通过“发散攻击”暴露出来。 最近一项对语言模型(包括 ChatGPT)的研究揭示了它们对特定训练数据的回忆和反思能力。 研究人员发现,ChatGPT 存在潜在的隐私问题,因为它可能会泄露敏感信息,例如电子邮件地址和**号码。
OpenAI 的 GPT 商店已推迟到明年。 OpenAI 的 GPT 商店发布已推迟到明年。 GPT 商店旨在成为用户销售和分享其 GPT 作品的市场,OpenAI 根据使用情况提供付费服务。
Pika 首次亮相,AI 生成器针对科技巨头。 Pika Labs 发布了 Pika 10,这是一个令人印象深刻的 AI** 生成工具。 它具有文本到图像和图像到图像转换等高级功能。 该公司还筹集了5500万美元的资金。
SDXL Turbo 简介:一种实时文本到图像生成模型。 Stability AI 推出了 SDXL Turbo,这是一种新的文本到图像模型,它使用抗扩散蒸馏 (ADD) 一步快速生成高质量图像。 它可以在短短 200 多毫秒内快速准确地创建 512 x 512 图像。
耗资1000万美元的人工智能数学奥林匹克竞赛成立。 已经宣布了1000万美元的奖池,以激励人工智能模型的开发,这些模型可以在国际数学奥林匹克竞赛(IMO)上获得金牌。 500万美元的大奖将颁发给第一个在批准的比赛中达到黄金标准的公开共享的AI模型。
Web 指南
LLM可视化。 此内容展示了著名的 Transformer 架构(包括 Nano GPT、GPT2 和 GPT3)的可视化和交互式表示。 它提供了清晰的视觉效果,并说明了所有块之间的联系。
黄仁勋的 NVIDIA 如何推动 AI 革命。 NVIDIA 首席执行官黄仁勋领导了公司的 AI 增长,实现了惊人的 2000 亿美元价值增长。 英伟达非常关注人工智能及其在各个行业的应用,已经超越了沃尔玛等大公司,成为第六大最有价值的公司。 黄仁勋在英伟达的股份目前价值超过400亿美元。
在人工智能时代,谷歌正试图对搜索进行大胆的改变。 谷歌正在通过改变搜索体验来应对来自生成式人工智能工具和法律诉讼的压力。 他们正在测试一项“笔记”功能,供公众对搜索结果发表评论,并引入“关注”选项,允许用户订阅特定的搜索主题并接收更新,类似于社交网络。
为什么 ai 包装器的评价很差?AI 包装器是利用 AI API 生成输出的实用工具,已被证明对创作者有经济回报。 Formula Bot 和 PhotoAI 等示例每年的收入在 200,000 美元到 900,000 美元之间。
从像素到可能性:AI 视觉。 利用 GPT-4V 进行可能的创新指南,例如屏幕截图到**和帮助视障人士。
有趣的**和存储库
vaibh**s10/insanely-fast-whisper。'insanely-fast-whisper'CLI 是用于转录音频文件的多功能工具。 它由 Whisper Large v3 提供支持,可以在 98 秒内转录 150 分钟的音频。
从 chatgpt 中提取训练数据。 研究人员发现 ChatGPT 的对齐训练存在缺陷,允许提取其训练数据,从而构成重大安全风险。 通过使用无意义的提示,该模型可能会无意中暴露其训练数据,只需 200 美元即可提取 10,000 多个独特的示例。
通用基础模型的性能能否优于专用调优?医学案例研究。 GPT-4 在使用一种称为 MedPrompt 的新方法回答医学问题方面超过了 MED-PALM 2。 通过利用三种先进的提示策略,GPT-4 实现了 902%的惊人准确率。
Merlin:给多模态LLM一个有远见的人。 研究人员建议在多模态法学硕士(MLLM)中增加未来的建模,以提高他们对该学科的基本原理和意图的理解。 受现有习范式的启发,预期预训练(FPT)和预期指令调整(FIT)技术用于此目的。 'merlin'是由 FPT 和 FIT 支持的新 MLLM,它展示了增强的视觉理解、未来推理和多图像输入分析。
Starling-7B:通过RLAIF提高LLM的有用性和无害性。 伯克利大学推出了Starling-7B,这是一种强大的语言模型,利用人工智能反馈强化习(RLAIF)。
Dolphins:用于驾驶的多模态语言模型。 海豚是一种视觉语言模型,旨在充当对话式驾驶助手。 它使用数据、文本命令和历史控制信号进行训练,以全面了解自动驾驶汽车的困难驾驶场景。