作者 Zhi Xing
经过20年的发展和积累,龙源已成为中国数字出版的代表性企业,其核心资产聚集了90%的全国性期刊杂志的数字内容。从一开始,这些内容就专注于文本格式的数字化生产和索引,使这些内容成为当今人工智能时代语言模型最有价值的支撑材料。 它创建了支持AIGC工具和区块链版权内容的知识服务模型。
娱乐资本专访了龙源传媒CEO唐洋,了解龙源传媒如何结合AI技术为知识创造更大价值,以及龙源未来有哪些计划和前景。
--- 以下为采访实录---
文科知识库是一个结合了AI大型语言模型和区块链内容库的使能平台
展望未来:您能介绍一下龙源和文科知识库吗?
唐扬,龙源传媒首席执行官,下同)。
龙源数字媒体(北京)有限公司是中国数字出版和数字媒体领域的代表企业之一,被业界和公众广泛认可为人文学科的重大期刊和杂志。 此外,该公司还拥有大量其他数字版权,包括书籍、音频IP,以及签约作者,包括专业作者和草根作者。 我们为公司定位的商业模式是“数字版权中台”。 2024年,正式命名为“知识树”平台。 我们的使命是“为知识创造价值,为知识创造者创造财富”。
展望未来:请您介绍一下文科知识库?
文科知识库是将龙渊的版权知识库与法学硕士相结合的大型语言模型集创新产品于一身。 核心功能是参与AI语言模型的生成过程,通过对文章摘要进行总结,添加个人观点,协助用户提高文章的质量和原创性。
如今,AI写作更多的是帮助用户整理思路,准确性不足。 很多时候,这是一个严肃的“胡说八道”。 “文科”可以让用户更容易搜索到自己想要的可靠知识,写出正确的内容,激活过去从图书馆书架上沉淀出来的知识内容,成为公共创新的新鲜主题。
所有创新都在“推动”:让人工智能辅助的内容创作更容易、更容易获得
Vision Future:版权所有者会觉得人工智能在剽窃我的知识产权吗?
以ChatGPT为代表的AI语言模型迎来了一个革命性的新时代。 它不断发展,发展速度比我们想象的要快。 版权问题是隐藏在ChatGPT背后的一个巨大问题。 这些大型语言模型号称是机器自动生成的,但实际上我们知道,生成的基础一定是现有知识内容的基础,但所用内容的粒度很小,而且数量很多,不可能“无中生有”。 所有的创新都是建立在过去的积累和整合之上的。
例如,如果我们以前写过一个 **,它可能主要受到 5 篇文章的影响,所以我会在 **之后对这些参考文献进行注释。 然而,ChatGPT可能已经引用了上千个**,它仍然需要被认可,对这些知识产权的承认和尊重需要从法律、职业道德、技术等方面解决,而“温科”就是朝着这个方向迈出的重要一步。
展望未来:“文科”的壁垒是什么?
所有产品的最高壁垒可能是价值,其次是庞大的专业版权内容库,然后是使其更易于使用的技术壁垒。 闻科的核心壁垒是龙源一直坚持的“知识主体性”价值观。 我们认为,知识产业的价值链是由知识创造者、知识使用者和知识体验者组成的。 其中,知识的创造者是基础,其次是知识的使用者,即使用者,最后是知识的经营者。 例如,Dragon Source、Google 和 OpenAI 都是知识运营商。 当然,还有龙源获得的海量知识产权著作权内容,可以作为用户创作的灵感、基础和依据。
世智未来:你也在做区块链吗?
右。 区块链技术平台一直在这样做。 国内的区块链平台大多只是一个技术链,区块链的确认和溯源价值必须与司法系统挂钩,并得到政府和法律的认可。 2024年,与北京市版权局牵头的“资本链”达成战略合作。 著作权确认的结果可以得到官方认可。 另外2024年,我们在北京师范大学成立了“知识区块链研究”,北京师范大学金融学院、工学院联合成立了“北京师范大学知识区块链研究中心”,不仅从技术角度研究知识内容确权和溯源问题,还从“一流”的角度研究区块链的“激励”机制。
展望未来:“温客”和AI产品未来的发展方向是什么?
“文科”的使命是将官方发布的版权内容库与ChatGPT相结合,弥补现阶段的不足和漏洞。 这包括潜在的版权问题和“政治正确”问题。
目前,几乎所有的大学、机构和**都明确禁止使用纯粹由chatgpt生成的文章。 主要问题是无法判断文章内容的原创性和正确性。
此外,对于普通用户来说,最基本的问题是无法给机器提供基本的指令和大纲,即提示。 我们升级的功能将通过PGC的内容和用户意见和判断的参与,帮助用户产生原创的基本想法和大纲。 而不是像现在这样完全由机器生成。
世智未来:还有商业模式的问题,“文科”是如何实现盈利和价值的?
严格来说,“文科”和龙源版权中台使用的是web30 模式。 它的核心特点是“分享”,而不是利润最大化。
我们的大部分收入会通过权利确认和溯源机制分配给所有拥有版权利益的各方,此外,对于平台的升级和运营也形成了良性的造血功能,主要通过会员制。
在第一阶段,我们将针对需要大量生产知识内容的领域的用户,包括***等数千万新运营商。 他们需要每天更新 *** 内容,但纯 GTP 内容平台不会接受。 原创内容的成本太高。 我们目前有两种类型的会员:基本会员和高级会员。 主要区别在于受版权保护的内容和其他增值服务的数量。
对于需要大量制作文章或内容的用户来说,完成一篇高质量的文章或内容的成本不到10美元,性价比极高。
我们不提供基于算力的大模型,而是通过协作接口API集成各种算法和模型,加上其他辅助工具的增值服务,以会员为主,为用户提供全方位的服务。除了方便免费使用“文心一妍”、“OpenAI”、“讯飞星火”等大模型外,会员还可以引用龙源知识库中的文章内容。 下一步,闻客还将为用户提供“知识微创”,让内容更便宜、更优质。
世智未来:据我所知,很多大厂都在寻找高质量的内容来训练大模型,你会把龙源知识库卖给他们吗?
很多大型企业也在构建自己的私域模式,服务于自己的行业和行业。很多大企业找过我们,希望把我们的版权内容数据卖给他们,以提高内部大模型的质量,但我们主要提供数据内容,而不是版权授权。
龙源知识库的版权内容数据是经过专家系统整理的知识系统内容,可以称为高度结构化的内容。 各种语言模型平台都重视此值。 我们希望他们能够按年支付,并将其与整体收入挂钩,并给予Dragon Sourcing适当的份额。 或者,我们成为更大型号的插件,用户在使用我们的产品时单独付费。
Vision Future:它与Scholarly相似吗?
是的,这是最接近我们的产品。 用户在撰写学术文章时需要引用文献,这个插件会显示出来。
Vision Future:你们是否为会员提供抄袭检查服务、AI检测工具等增值服务?
右。 AI检测工具可以推断AI在内容生成方面的比例。 测试报告的准确率非常高,底层数据和CNKI的重复检查检测是科技公司,其实是学生买单。 例如,清华大学使用各种检测工具来检查学术不端行为。 不过,这种重复查验服务模式主要是为了“除恶”,而AI检测工具却是引导行业走向“善”。
展望未来:温客知识库目前有多少成员?
目前仍处于试运营阶段,注册用户超过10万,其中重度用户占30%,每天产生100多篇文章。 在过去的三个月里,我们将赠送免费试用会员。 在这个阶段,我们不追求利润。
“我们一直在为基于人工智能的知识区块链社会做准备”。
愿景智慧未来:《温可》拍了多久?
“文科”的研发时间并不长。 但可以说,龙源20年来一直在为一个基于人工智能和知识区块链的社会做准备。
龙源在成立之初就确立了“为知识创造价值,为知识创造者创造财富”的宗旨和使命。 “为知识创造价值”是针对知识服务器的。 知识传播得越广,利用得越充分,知识的价值就能得到最大程度的体现。 将知识锁在抽屉里不会显示价值; “为知识创造者创造财富”是为版权所有者准备的。 必须充分保护知识创造者的利益,使知识生产能够继续流动和繁荣。 建设一个以知识为主体的社会,比一个以权力为主体的社会,一个资本主义社会,是一个更理想的未来社会。 实现这一理想的技术支持是区块链和人工智能技术。 从这个意义上说,我们的追求是一致的,我们从一开始就一直在为基于人工智能的知识区块链社会做准备。
未来:“知识树”平台的功能和目标是什么?
“知识树平台”是一个一体化的生态系统,包括区块链确权平台、AI创作平台、内容分发平台及相关辅助工具,形成未来知识服务的完整价值链。
Dragon Sourcing 在 20 年前开始格式化其所有内容,并进行了全面的关键字索引。 这也让我们的内容不仅可以轻松转换成语音版、繁体中文版甚至**版,还可以借鉴AI工具,按照最基本的逻辑单元对内容进行重新整理。 而这正是大型语言模型需要建立储备的。
本文中介绍的对话内容仅反映受访者的个人意见)。