生成式人工智能在新闻制作中的应用:现实世界的问题及其应对

小夏 三农 更新 2024-02-06

作者:陈莎(山东大学文化传播学院博士研究生)。

*: 青年记者,2023 年第 19 期。

导语:生成式人工智能在辅助新闻生产、推动新闻报道创新的同时,也存在事实不准确、算法不透明、应用边界有争议的问题。

生成式 AI,或称“生成式 AI”,是一种 AI 技术,专注于生成或创建新内容,使用现有数据集(如文本、音频或图像)进行机器学习,然后生成全新的内容。 [1] 随着 GPT-4 及其衍生模型的出现,生成式 AI 变得越来越强大,除了文本写作外,它还可以处理语音、图像和手势等多种文本格式。 它不仅继续成为新闻报道中的重要话题,而且正在成为新闻生产链中的重要基础设施,这意味着新闻生产将正式进入全方位的人机协作模式。 如何负责任地使用这些技术已成为一个亟待探索的问题。

生成式人工智能在新闻制作中的应用类型。

利用人工智能辅助新闻制作是数字化转型的重要路径。 在过去的十年中,智能新闻制作的创新经历了三个阶段:自动化、增强和生成。 [2] 与前两个阶段相比,生成式人工智能由于在算法系统中增加了预训练、指令调优和基于人类反馈的强化学习,因此具有更广泛的应用场景。 学者Diakopoulos总结了记者使用生成式AI辅助新闻的13个场景:内容发现、文件分析、翻译、提示指导、社交内容创建、自动化写作(结构化数据)、自动化写作(非结构化数据)、新闻线索发现、摘要生成、评论审查、内容格式转换、标题优化、AB测试、个性化分发等。 [3] 不同的**生成式AI接入有不同的路径,使用场景和功能应用也会不同。

目前,国内外生成式人工智能的应用方式主要有三种。

1)通用刀具类型。

通用工具类型与生成式AI系统之间的关系是相互独立的,与平台的其他用户一样,他们可以通过登录生成式AI服务平台,利用其功能辅助新闻采集和写作。 通常,**人只需要注册一个平台账号即可使用该产品。 这种方法成本低、灵活,是访问生成式 AI 的最常见方法。 以ChatGPT为例,记者可以在聊天对话框中输入需要查询的问题,并在对话框中给出提示工程指令,ChatGPT可以快速提供自己的知识库信息。

在图片阅读和短篇编辑的时代,视觉元素变得与信息并重,以抖音为代表的社交媒体平台在其编辑应用中开发了自动化编辑功能,这反映出生成式AI不仅可以将复杂的事件和深奥的数据转化为易于理解的图表或图像,还可以通过视觉生成能力创造传统新闻无法达到的效果, 为新闻制作提供更多创新的可能性。[4]目前,新华社音频部成立了AIGC应用创新工作室,《AIGC实话实说》发表了5篇创意短文,质量过硬,传播效果好。

2)平台访问类型。

平台接入类型是提供内容生产API接口的生成式AI系统平台,提供内容分析、情感分析、事件提取、摘要生成、个性化推荐、内容审核、可视化生成等服务。 在这种类型的人机协同生产中,第一人主要负责提供文本数据,机器负责输出和呈现。 在机器与终端用户的交互中,它扮演着终端用户与生成式AI交互之间的中介角色,即提供和设置新闻议程的原始文本——生成式AI系统平台负责技术实现——提供终端显示,其本质是终端用户与生成式AI平台之间的交互。

《纽约时报》利用 ChatGPT 创建了一个带有提示组合的情人节消息生成器,一个名为“A Valentine, from A”的互动新闻活动。i.To You“,由国内澎湃新闻的移动端新闻分享功能自动生成的海报新闻,是平台访问类型的典型代表。 在传统的互动新闻制作中,需要编写和算法来设计互动新闻的互动主题,但通过介入生成式AI界面,生成式AI只需发布互动新闻设计指令,就可以自动生成互动新闻产品。 在某种程度上,生成式人工智能可以以相对简洁的方式帮助记者进行创造性的表达。

3)专有系统类型。

这类应用的构建需要强大的技术支持,比如建立数字图书馆,为自己开发专有算法。 它的优势在于,一方面可以将最佳价值嵌入到系统中,生成符合最佳定位的内容; 另一方面,源数据库来自**本身,脏数据源相对较少,可以降低输出偏差的风险。 它通常具有较高的投入成本,适用于特定的大型**群体**,例如经济、体育、政治等领域的商业**。

由学术机构开发的支持多角度新闻报道的 AngleKindling 和彭博社发布的 BloombergGPT 就是这种类型的生成式 AI。 专有系统采集不同新闻主题的多种报道角度和方法,可针对一流数据进行针对性训练,通过情感分析、命名实体识别、新闻分类、问答等方式生成多角度行业报道。 换言之,这种专有的生成式人工智能可以被调用在新闻制作的策划、收集、编辑、校对、审校、分发等过程中,在辅助新闻制作的各个环节提供独特的个性化服务,满足特定信息的需求,包括:(1)对自然语言的专有解释,如在金融互动系统中, 输入“apple”将更多地指向 Apple 而不是水果苹果;(2)与专有数据库的链接,例如与上市公司时事交易数据库的链接; (3)特定风格的新闻设置,如制作适合**定位的自动化新闻写作等。

生成式人工智能参与新闻制作的现实问题。

和人类一样,机器也不是万能的,它们参与生产的内容也会犯错,不同的人对人机交互有不同的认知。 在实践中,生成式人工智能辅助新闻生产仍存在以下问题。

1) 提供不准确事实的风险。

真实性和准确性是新闻报道的基本原则,但在翻译复杂的世界时,没有任何技术可以 100% 准确。 挪威报业集团Schibsted发现,在其实验性的生成式人工智能辅助新闻摘要中,每10个内容中就有1个包含“幻觉”或虚构元素。 [5] 同样,当ChatGPT遇到数据库没有的数据时,它不会直接告诉自己不知道,而只会编造一个答案,提供虚假的事实。

究其原因,主要是由于技术的局限性。 目前,生成式人工智能在逻辑推理、可靠性、鲁棒性、准确性和安全性方面仍存在一定的局限性。 [6] 首先,生成式人工智能本质上是使用机器学习来理解自然语言,它的理解方式和决策决策是由统计概率给出的,换句话说,它更擅长做出统计决策,而不是准确的逻辑推理,例如数学或一阶逻辑,后者经常给出错误的答案。 其次,虽然生成式AI产生的知识来自大型模型语言数据库,但这些数据库只是与现有的网络数据相关联,而集成知识是现阶段在互联网上可以追踪的知识,不是实时更新的,反馈知识在时间上是有限的。 此外,网络数据库本身包含大量不准确的数据,这也会影响输出决策的准确性。 同时,生成式AI大多基于大型语言模型,巨大的数据量加剧了数据噪音,可能导致模型强行捏造训练数据中不存在的概念,并生成看似正确但实际上不准确的决策。

2)“算法透明度”不规范。

自新闻生产进入算法转向以来,算法的不透明性和算法黑匣子带来的算法偏见削弱了公众对新闻的信任,学术界呼吁智能新闻生产遵守算法透明的伦理。 算法透明度是一种试图通过算法阐明信息披露的机制。 对于最终用户来说,人机协作新闻生产中的算法透明性意味着披露算法的存在。

目前,大多数**算法都缺乏透明度意识,在自动化内容生成中,要么不披露算法的存在,要么不知道如何披露。 2022年,美国科技公司**cnet悄悄发布了数十篇AI生成的报道,这些报道因没有披露作者的算法身份而受到新闻界和用户的强烈批评,[7]不仅传播虚假事实,还因为算法作者身份的不透明性。 由于信任的习惯,公众尚未与生成式AI技术建立良好的信任关系。 在美国,调查发现,78%的人认为依靠软件写文章并不是一件好事。 [8]

3)对适用边界存在争议。

生成式人工智能的计算能力可以提高新闻采集和编辑的效率,但并非所有类型的新闻都适合机器自动化。 对于一些涉及敏感数据的道德故事,任何小错误都可能导致系统性风险和声誉受损。

新闻采集和编辑涉及的敏感数据包括机密文件,以及新闻**、员工、客户或商业伙伴或其他自然人的机密信息、商业秘密或个人数据,如果将这些数据输入人工智能系统,则存在信息泄露和侵犯他人隐私权的风险。

人类敏感的话题,如讣告和具有强烈人文关怀的严重问题,是否可以用生成式人工智能来报道,仍然存在争议。 ChatGPT在密歇根大学汇编事件信息的行为遭到了学生们的反对,他们认为使用人工智能来汇编和发送有关人类悲剧的信息是对生命的不尊重,也是不道德的。 [9] 在人机协作的智能媒体时代,人类对自动化生产的信息接受度并不高。 在目前大众的认知中,他们仍然会从人类中心主义的角度来评价自动化行为,尤其是在人类伦理方面,公众普遍会认为机器产生的信息缺乏“光环”,他们会更喜欢与生活问题相关的未经中介的报道。

人机协作新闻制作的应对策略。

面对存在的问题,不仅要正确认识生成式AI的内容生产机制和局限性,还需要建立一系列规范来优化人机协同生产流程。

1)优化编辑过程。

其实,在新闻采集和写作的过程中,记者也会提供不准确的信息,解决办法就是设置编辑来检查报道是否真实准确。 鉴于技术的固有缺陷,人们能做的还是做好技术风险的控制,重视人在人机协同生产中的重要性,优化人机协同新闻生产的流程。

优化编辑流程的第一个关键是提高第一人的媒体素养,让他们能够正确理解生成式人工智能的内容生产机制和局限性。 不同平台上的AI系统在内容生成方面会有不同的功能和性能,因此需要提前学习相关知识。 此外,把关智能系统提供的事实及其报道是减少假新闻生成的必要过程,包括验证生成式人工智能提供的信息,或设置专门的人工智能编辑器来自动化新闻制作。 面对自动化内容大规模生成的现实,英国《金融时报》设置了AI编辑器,降低自动化内容风险; 新闻编辑室要求所有人工智能生成的内容在必要时由记者检查和修改。 荷兰通讯社ANP在其关于人类监督和参与生成式人工智能生产的指南中提出了一种“人-机-人”的过程协作模型,指出在使用人工智能或类似技术时,有必要“支持最终编辑,前提是最终检查是由人类在事后进行的”,即**和决策都由人类监督。 [10]

2)算法信息的披露。

自 ChatGPT 发布以来,已有多家 ** 在用户社区中征求用户对 AI 生成内容的意见,以“self**”平台 Medium 社区为例,不少用户提到算法透明和披露的必要性。 因此,建立透明的规范和公开算法信息是人机协作内容生成阶段的重要伦理问题。 可以为最终用户实施两种类型的透明度政策。

1.通知算法信息。 例如,Medium 的第一个关于使用 AI 语言工具的“透明度、披露和出版级指南”政策规定,在使用生成式 AI 工具创建提交的任何部分时,创作者必须像引用任何其他 ** 一样引用它。 [11]

2.告知人们参与信息,并对自动化参与内容进行分类和分层管理。 例如,对于纯自动化内容,主动识别为高风险信息,并注明是自动化生产,未经人工审核,存在事实不准确的风险; 对于人机协作生成的内容,将其标记为中低风险,告知人类参与信息等。

3)规范机器的适用边界。

在当前的人机协同新闻生产中,第一人应该对机器参与内容生成有边界意识,协调新闻方、用户、用户在人机协同生产中的权益。

基于此,更智能的新闻编辑室大多将生成式人工智能限制在非敏感新闻的制作上。 以专注于智能新闻制作的新闻编辑室为例,平台上的内容主要是对现有报道的处理,为了防范风险,平台还根据内容主题对风险进行管理,并针对不同的风险类别做相应的人工审核。 如果认为不适合机器内容制作的问题属于高风险,则禁止将相关主题数据上传到系统。

结论。 生成式人工智能在新闻生产中的应用,不是让机器代替记者做决策,而是让记者定义报道的角度、风格和价值取向,目的是提高人机协作产生的内容质量。 为此,学术界和业界需要进一步探索更实用的数字新闻伦理,规范技术使用,防范新闻算法的风险。

本文是2021年重庆市教委社会科学规划项目“智能媒体时代重庆政务传播平台拓展与战略创新”(编号:21SKGH243)的中期成果。

参考文献: 1]Gozalo-Brizuela R, Garrido-Merchan e C chatgpt is not all you need. a state of the art review of large generative ai models[j].

2]marina adami.is chatgpt a threat or an opportunity for journalism? five ai experts weigh in[eb/ol].(2023-03-23)[2023-04-10].

3]nick diakopoulos.what could chatgpt do for news production?[eb/ol].(2023-02-10)[2023-04-10].

[4] AIGC改变了新闻业[EB OL]。微信***腾讯**研究院“, 2023-08-28

5]johannes gorset.schibsted experiments with ai, finds 37+ ways it can help[eb/ol].(2023-03-27)[2023-05-01].

6] zhou j, ke p, qiu x, et al. chatgpt: potential, prospects, and limitations[j]. frontiers of information technology & electronic engineering, 2023: 1-6.

7]paul farhi.a news site used ai to write articles, it was a journalistic disaster[eb/ol].(2023-01-17)[2023-04-10].

8]artificial intelligence use prompts concerns[eb/ol].(2023-02-15)[2023-05-01].

9]jennifer korn.vanderbilt university apologizes for using chatgpt to write mass-shooting email[eb/ol].(2023-02-22)[2023-04-01].

10]hannes cools, nicholas diakopolulos.writing guidelines for the role of ai in your newsroom? here are some, er, guidelines for that[eb/ol].(2023-07-11)[2023-09-18].

11]scott lamb.how we’re approaching ai-generated writing on medium[eb/ol].(2023-01-27)[2023-04-10].

本文引用引文格式:

陈莎. 生成式人工智能在新闻生产中的应用、现实问题及其应对[J].青年记者, 2023(19): 57-59

相似文章

    制氮机在啤酒生产中的应用

    氮气作为自然界中最重要的惰性气体,可以完全取代CO在啤酒生产中作为保护气体的作用 除了在白酒中填充二氧化碳 而PSA N设备中氮气的整体投资和单位体积的低成本是CO 装置无法比拟的。同样,氮气作为自然界中最重要的惰性气体,对啤酒质量的影响是无菌压缩空气无法企及的。.啤酒 葡萄酒和果汁饮料的氮气和保鲜...

    集散控制系统在现代生产中的应用及优势

    集散控制系统 DCS 是广泛应用于工业生产过程自动化控制的系统。它通过计算机网络技术将生产过程中的各种控制设备连接起来,实现对生产过程的实时监控和优化控制。与传统的集控系统相比,集散控制系统具有更高的灵活性 可靠性和易用性,已成为现代工业生产的一部分。化工生产。化工生产过程涉及大量的化学反应和物料输...

    卷板机在电力设备生产中的应用

    卷板机在电力设备生产中的应用在电力设备的生产过程中,卷板机是应用广泛的重要设备。主要用于钣金的压接 切割 成型。应用范围涵盖许多领域,包括电力设备的制造。首先,卷板机在电力设备的制造中起着至关重要的作用。电力设备通常需要使用大量的金属板,如钢板 铝板等。这些板材需要通过折弯机进行加工,以满足不同设备...

    折弯机在实际生产中的应用案例

    折弯机已成为现代工业生产中不可缺少的重要设备。凭借其高效率和高精度,它在产品加工中发挥着重要作用。本文将对折弯机在实际生产中的应用案例进行深入分析,以及其他一些与产品加工相关的内容,旨在为读者带来更丰富的知识和全新的视角。首先,折弯机在金属制品加工领域有着广泛的应用。以钣金加工为例,折弯机能够根据设...

    MES母液在工业生产中的应用及影响

    MES母液 MES母液,全称甲基乙二醛肟硫酸盐溶液,是一种广泛应用于工业生产的化学物质。其独特的化学性质使其广泛应用于许多领域,特别是在医药 农药 染料和高分子材料等领域。然而,随着其应用的普及,MES母液引起的环境问题逐渐凸显。MES母液的制备主要通过氧化 还原等化学反应来实现。其分子结构中的特殊...