记者李静北京报道。
近日,外媒报道称,字节跳动正在利用OpenAI技术开发自己的大型语言模型,OpenAI的服务条款规定,公司输出的模型不能用于“开发任何与我们产品和服务竞争的AI模型”。 尽管字节跳动通过微软购买了OpenAI的访问权限,但Microsoft也制定了与OpenAI相同的政策。 因此,字节跳动违反了OpenAI的服务条款,其账户已被OpenAI暂停。
字节跳动发言人乔迪·塞斯(Jodi Seth)回应称,GPT生成的数据被用于“种子计划”(字节跳动底层大型语言模型的代号)的早期开发中,用于对模型进行标注,并在今年年中左右从字节跳动的训练数据中删除。 “字节跳动已获得Microsoft许可,可以使用GPT API。 “我们使用GPT为非中国市场提供产品和功能。 但在中国,我们使用自己的模型驱动的“豆包”(字节跳动的人工智能对话机器人)。 而且豆包只在中国有售。 ”
针对具体情况,12月17日,字节跳动相关负责人回应《第一财经日报》记者称:“公司在使用OpenAI相关服务时,强调必须遵守其使用条款。 我们还与OpenAI保持联系,以澄清外部报告可能造成的误解。 ”
字节跳动表示,今年年初,技术团队刚开始对大模型进行初步探索时,有工程师将GPT的API服务应用到小模型的实验项目研究中。 该模型仅用于测试,没有上线计划,也从未在外部使用过。 在该公司于 4 月推出 GPT API 调用规范检查后,这种做法已停止。
字节跳动还表示,早在今年4月,字节跳动大模型团队就已经提出了明确的内部要求,包括不将GPT模型生成的数据添加到大模型的训练数据集中,以及培训工程师团队在使用GPT时遵守服务条款。 9月,公司又进行了一轮内部检查,并采取措施进一步确保对GPT的API调用符合规范的要求。 例如,通过批量抽样的方式检测模型训练数据与GPT的相似度,防止数据标注者未经许可使用GPT。 在接下来的几天里,我们将进行另一次全面审查,以确保严格遵守相关服务的使用条款。 ”
对于Open AI切断字节跳动API接口的做法,富资本创始合伙人、星星AI董事长李明顺认为,这其实反映了大模型公司对强势应用的恐惧,就像Open AI害怕亚马逊、谷歌、Mata推出大模型和应用一样。 因为大模型已经逐渐成为一张明牌,大家竞争的不再是技术基础,而是有多少用户,多少场景,多少钱才能继续寻找算力。 因此,用户数量、场景、投资能力将成为这波大规模模型竞争的核心,而在此背景下,大规模模型本身的重要性将降低。
12月16日,创始人、董事长兼CEO李彦宏再次发声:“在过去的一年里,我看到大家对大模型的关注还在基础模型上,而不是在应用上,我有点着急。 我们必须去研究 AI 原生应用程序的“数量”,而只有做到这一点才有价值。 为什么不认真做AI原生应用,关心大模型的进度呢?这种进步对大多数人来说不是一个机会!百模大战是对社会资源的极大浪费,应该把更多的资源放在超级应用上。 ”
像字节跳动这样拥有庞大用户群的公司,是Open AI所害怕的,因为未来很多像字节跳动这样的产品都会嵌入AI。 李铭顺表示,尤其是在剑英(海外版是Capcut)等AI短**制作工具使用后,未来可能会成为全球首款短**工具,远远超过今天大家看到的Pika、Gemini等。 “因为剑影和Capcut在全球有5.6亿月活跃用户,在短**工具上应该是无可匹敌的,剑影和Capcut拥有大量的用户,还有抖音、TikTok等场景。 未来,如果剑英或Capcut分开,可能会成为AI领域千亿美元级别的短期AI工具。 在这场竞争中,场景变得比技术更重要。 ”
据了解,今年6月28日,字节跳动发布了“火山方舟”大模型,但“火山方舟”并非自主研发的大模型,而是一个大模型服务平台,主要整合了智发AI、Minimax、百川智能等7家AI科技公司和科研院所的大模型,为外界提供服务。 至于自研大模型的具体流程以及应用的相关情况,字节跳动目前尚未透露更多信息。
编辑:张景超 校对:闫景宁)。