人工智能时代的社会科学研究

小夏 教育 更新 2024-01-31

人工智能不仅成为引领新一轮科技革命和产业革命的重要推动力,而且对包括社会科学在内的知识的生产和传播产生了深远的影响。 聚焦人工智能时代社会科学研究的新发展、新趋势、新挑战《中国社会科学报》邀请了米加宁、高琪琪、邱琳三位学者进行讨论,希望通过对话促成共识,呈现分歧,激发变革时代社会科学研究的思想火花。

chatgpt本质是大模型

中国社科报记者:我们说ChatGPT的出现是人工智能史上的一个里程碑。 如果用一个词来形容ChatGPT的本质,或者说是革命性的突破,那会是什么?我们可以看到有用的生成式AI、通用AI、大型语言模型等不同表达背后的差异吗?

邱琳:我主张用大模型来理解ChatGPT。 为什么不使用“生成式”?因为生成式语言模型实际上自人工智能开始以来就已经存在。 就像最早的伊丽莎一样,它是对话式的,但它基于非常简单的规则。 例如,如果你告诉它“我今天心情不好”,它会挖出关键词“心情不好”,并生成“你为什么心情不好?“虽然这种对话非常僵化和机械,但它本质上也是生成性的,会根据你的输入对你做出回应。 当人工智能首次开发对话机器人时,它是一个非常令人惊讶的工具,因为它最初的目的是用作通灵者,人们可以通过与聊天机器人聊天来表达更多内容。 因此,生成式对人工智能有一定的历史,并不新鲜。

之所以称大模型,是因为ChatGPT目前的数据量是有史以来最大的,再加上其惊人的计算能力,导致了这种爆炸性的智能行为。 它与之前的生成式AI最大的区别在于它的训练集是超大的,它背后的算法也与之前的算法不同,是基于神经网络的机器学习,更加智能的自学习。

Miganin:生成式 AI 已经存在了很长时间,但 ChatGPT 的生成方法非常独特。 为什么以前没有使用生成式人工智能?那是因为以前生成的内容质量很差,而且在生成内容时,它不够智能。 直到今天,生成式人工智能才真正达到了可以使用的地步。

GPT 代表 Generative Pre-Trained Transformer,翻译为生成式预训练转换器。随着 Chat 的加入,我认为 Open AI 是出于商业原因。 但在中文中,很容易理解为聊天机器人,甚至使用效果也不如普通聊天机器人。 事实上,GPT是三个要素的集合:一个是大模型,第二个是大算力,第三个是大语料库,都缺一不可。 在这个整体中,大算力是核心,因为算力有多大,语料库能处理多少;可以使用多少计算能力来构建模型。 在中美科技战中,美国为什么要从芯片上打压我们?因为芯片是算力的基础,如果芯片被控制,算力就上不来了。

高启琪:我同意从大模型来定义ChatGPT。 从概念历史的角度来看,生成式人工智能的概念早于大型模型。 三四年前,我们谈了很多关于AIGC,即AI生成内容,即由人工智能自动创建和生成的内容。 这个概念有两个相关的概念,一个是PGC,专业生成内容,即专业生成的内容;一个是UGC,USER

生成的内容是用户生成的内容,即人工生成的内容。 AIGC的概念早于大模型,而ChatGPT出现后,人们为了更好地定义它,越来越倾向于使用大模型。 实际上更准确地说,它是一个大型语言模型。这种语言源于人工智能语言的四种基本分类——机器视觉、语音生成、自然语言和机器人中的自然语言分类。

补充一点,这个大模型不仅数据量大,而且参数大还有一个更本质的特征。因为这种算法最重要的特点是它模仿神经网络。 GPT-3 的参数数量为 1750 亿,GPT-4 尚未正式公布,但可以知道它是一个混合专家模型(MOE,Mixture of expert),是一个结合了不同小模型的模型。 因此,早期的人工智能是建立在规则之上的,即符号主义;神经网络的发展其实是关联主义,而目前的大模型更多的是关系主义。

它不仅仅是一个新工具,更是一种新的范式

中国社科报记者:近年来,随着新技术的发展,学术界特别是公共管理领域出现了范式转变的呼声,比如倡导构建数据驱动的新型研究范式。 大型模型的出现为社会科学研究开辟了哪些新的可能性?

Miganin:在大模型出现之前,社会科学的研究范式主要包括定性研究、定量研究、**研究和大数据研究。 大数据于2024年提出,自提出以来对社会科学产生了巨大影响。 在此之前,以前的社会科学研究是基于对个体问题的研究。 孔德一直主张社会科学要与自然科学处于同一水平,他非常推崇经典物理学对自然界的研究,希望社会科学能像物理学一样找出一些规律。 孔德之后,社会科学开始进行大量模仿自然科学的定量研究。 然而,这些研究进展甚微。 因为社会科学的研究对象是超复杂的,所以用定量的方法进行研究,就相当于用简单的定量方法处理复杂的问题,就像用因式分解的方法解决球面面积划分的问题一样。 事实上,定量研究只能在非常小的领域进行,比如公司治理,因为公司有明确的边界和标准化的数据可以进行一些回归分析。

社会科学的复杂性更像是一个新出现的问题。 比如美国的通货膨胀,美联储为什么不用计量经济学来做一个模型来解决呢?因为它知道通货膨胀率是美国社会现实世界中各种因素相互作用的结果,包括消费者、银行和生产者之间的相互作用。

大数据出现后,大家都以为大数据可以有一些解决方案,想通过大数据洞察人类行为,但是他们没有成功。 大数据从未形成一流的体系。 今天chatgpt来了,首先是认识论的改变,然后是方**的改变,解决了地面问题。 因为在过去,它是基于问题的研究,基于事件的研究;而ChatGPT是建立在人类整体智慧的基础上的。 认识论上的转变是你对社会系统、对复杂性的理解的改变。 例如定性研究和定量研究将社会的复杂性超级简化,而研究似乎想模拟社会的复杂性,甚至将其与大数据结合起来搞数字孪生,但并不能真正解决问题。 ChatGPT 带来了及时、灵活和快速的生成式治理解决方案。 为什么它是生成式的?比如在应急管理领域,过去我们做应急管理的时候,做的第一件事就是找出应急预案,一步一步地按照应急预案去做。 然而,面对超复杂和不确定性,怎么会有计划呢?其实,应急管理的过程往往是根据经验来解决的,但经验毕竟是有限的。 chatgpt来后,可以针对每个场景给出决策支持系统和决策支持计划,以便决策者在经验的基础上参考给定的解决方案,并随着危机的进展不断产生新的解决方案。

作为第五种研究范式,大模型必须走上一条新的道路。 在大数据出现之前,社会科学项目是由理论驱动的,而大数据作为第四种研究范式,形成了数据驱动的社会科学研究。有了大模型,最重要的是解放思维框架。 以前它是基于问题的解决方案,后来是基于事件的解决方案,不是从经济学的角度,也不是从政治学的角度,解决起来是多么容易。

高启琪:定量、大数据、大模型其实是同一事物的不同发展阶段,它们都用到了计算机科学的方法。 归根结底,它们都是定量的,定量的。 大型模型的开发肯定会使这种定量方法变得更加容易,因为它试图捕捉所有可能性。 但这在理论上是不可能的,因为任何事情都会产生新的变量。 如果它真的要耗尽,它将进入一个封闭的系统。

邱琳:过去很多社科研究的样本都比较小,比如在一个心理学实验中,100个人可能被分成两组,对照组和对照组可以比较发现差异,但要追踪现实生活中的数据,比如购物、吃饭、交通等,是非常困难的。 而大数据带来了颠覆性的变化,因为它让我们获得了海量的数据,比如通过社交**可以衡量24小时内的情绪变化。 这些实时、海量的数据弥补了原有社会科学研究中样本量过小的问题。样本量太小意味着研究的泛化能力很差,而大数据扩大了我们的视野和数据量,使我们能够研究以前没有研究过的现象。 这就是大数据的优势。

现在谈论大模型与大数据不同。 对我来说,大模型是一个改变游戏规则的工具。 它可以在社会科学研究的广度和深度上实现质的飞跃。 例如,根据最近的报道,Jean研究员chatgpt生产一个可以走路的机器人。 人类经常想象类似于人类或动物的机器人,这限制了我们的思维;和 ChatGPT给出的答案超出了人类的想象——它设计有一块海绵,上面有很多孔,通过向其中泵送空气来移动。 可以看出,它具有很强的创造力。 这将极大地促进理论创新。 事实上,ChatGPT可以从文献综述、理论生成、研究设计、数据收集、数据分析等多个方面赋能社会科学研究。

大模型对人类社会的理解,不是孤立的理解,而是全局观的理解,是系统的理解。 利用大数据进行研究,比如基于微博上的数据分析人们的情绪变化,或者看交通拥堵和出行模式,这些研究还是基于部分数据来描述人类行为,因此由此产生的理论还是比较孤立的。 现实生活是一个非常复杂的系统。 使用大型模型,它可以生成一个模拟系统,模拟非常逼真的个人和群体行为。 就像斯坦福大学研究团队打造的智慧小镇一样,里面智能体会产生非常可信的、类似人类的行为。 过去,对个人的计算机模拟非常简化,并以非常机械的方式设置他们的行为。 在这个镇上,你可以告诉他们中的一个人你想组织一个情人节派对,那个人会告诉别人派对要什么时候举行,镇上的其他人会互相要求和谁一起去,他们会记住时间,并在确切的时间和地点出现。 它们不再局限于建模时建立的简单行为规则,而是大模型根据幕后的交互生成相应的行为。 这种虚拟环境中的互动场景与现实生活相似,为社会科学研究者研究个体和群体行为提供了极大的便利。

我们最近的研究还表明,大型模型能够模拟受访者生成大规模的调查数据。 2023 年 3 月,皮尤研究中心对 10,441 名受访者进行了一项调查,内容涉及美国公民对俄乌冲突的看法以及拜登**的回应,共提出 8 个问题。 我们在 2023 年 6 月进行了一项研究,旨在将 ChatGPT 引入俄乌冲突和皮尤研究中心 2023 年 3 月的问卷问题,然后要求其**美国受访者选择每个问题在每个问题上的百分比。 研究表明,在 8 个问题中,ChatGPT 对 7 个问题的 ** 与调查结果的方向一致。 我们还在皮尤中心的其他三个民意调查中做了同样的实验,都得到了类似的结果。 这说明大模型已经掌握了人们的心理状态和思维方式,将能够在社会科学研究中取代人类受试者。

中国社科报:如果像ChatGPT这样的大模型具备了模拟受访者生成大规模数据调查的能力,那么问卷调查等研究方法还有空间吗?

Miganin:我想再次强调认识论的转变,即知识是通过传播产生的系统的生成变成了基于大型模型中人类知识的数百万个大脑的生成。 这里最重要的一点是,是相信个人的力量,还是相信大榜样的力量。 我们过去的社会科学研究是建立在个人力量的基础上的。 我觉得个人的力量是微不足道的。 在大模特面前,个体只是作为催化剂而存在。 未来的研究是找出谁更擅长与大模型对话,以及它将产生的解决方案越好。 无需考虑假设、数据或模型chatgpt这一切都可以解决。 只要上下文处理得当,就可以将单个问卷作为小语料库提供给大模型。 大模型生成的内容必须更可靠。 所以就民调而言,不是让chatgpt和民调进行对比,而是用它来看民调是否准确。

邱琳:诚然,大模型模拟的结果与轮询结果非常一致,但这并不意味着现在可以完全依赖大模型的模拟。 首先是数据沙漠问题在一些地方,互联网上的数据较少,数据训练集不足,因此很难依靠大型模型进行仿真。 二是即使有数据,也未必能真实反映线下人的心理。

当然,从长远来看,数据荒漠的解决只是时间问题。 可想而知,如果将一个大型模型装载到无人机上,投放到世界各地收集数据,不仅可以采集地形,还可以观察人类社会,实现人机对话。 如果数据可以全息实时收集,那么当前的轮询数据或**数据只是它的跟踪数据。 关键是谁来安装它,这是一个大问题。

大模型可以提出研究问题,收集数据进行验证,从而形成闭环,自主产生科学知识。从这个意义上说,研究的未来不在于如何利用大模型作为工具,而在于由它主导的科学研究过程。 尽管在不久的将来更多的讨论是关于人机协作的但我**的事情是,它会越来越占主导地位,人们会扮演一种指导的角色,扮演教练或导师的角色,通过提示、指导来参与研究。 随着大型模型的能力越来越强,它们将自行产生更多的科学知识,这也将改变科学研究的进行方式。

新格局下的学科与理论

邱琳:随着大模型的赋能,理论将从孤立的单一理论转变为系统的理论,成为对整个系统的描述。 因为以前的理论往往以一个或几个变量结束,而另一个变量则结束。 例如,如果只考虑如何通过补贴来提高家庭生育意愿,那么关于提高生育意愿的研究就会结束。 但在实践中,如果女性都生了三个孩子,可能会因为花更少的时间专注于工作而降低女性的社会地位,这会导致女性不想生孩子,这也会削弱补贴的效果。 因此,如果没有对两个或几个变量之间关系的系统全局视图,就不可能真正解决或观察问题。 我相信,大模型将改变我们产生的理论,这些理论不再那么孤立,而是描述整个系统的理论。

中国社科报:未来理论会越来越少,还是只需要一个理论?这就像有一位学者在讨论chatgpt知识的可能统一?

Miganin:这种理解还是一种传统的思维模式,未来是无法用传统观念来解释的。 比如,如果大平台被传统经济学理解,就是垄断,但大平台绝对不是垄断因为它不是传统企业在物理空间中的概念,所以可以在物理空间中进行重组。 传统的经济概念都无法解释数字空间和数字经济的现象,现在需要创造一套新的解释。

中国社科报:未来人类的知识状况如何?就是打破以学科为主构建模式?

米加宁:在这个问题上,正如维特根斯坦所说,如果我们不能说出来,我们应该保持沉默。

邱琳:有了大模型后,我们会从原来的解释导向进一步转向解导向,更加关注如何解决实际问题。 实际问题的解决将包括心理学、经济学和社会学的变量,......这是一个收敛的解决方案,一个无学科的解决方案。 例如,财富分配是一个完整的系统,其中变量分布在不同的领域,大模型产生一个综合的跨学科方案。 这个方案中有很多参数,这是一个非常复杂的方案,我们可能不理解。 大模型的任务之一就是如何用最简洁的语言告诉我们一个复杂的理论,并将其转化为人们可以认识和理解的理论。

中国社科报记者:学科的消解,对知识体系来说是一个非常大的变化。

邱琳:理论之所以重要,是因为它让我们对世界有了理解,并提供了提供框架的东西。 理论是一种工具,可以让我们毫无焦虑地生活在这个世界上。 因此,我们倾向于追求简单易懂的理论。 然而,这些理论往往过于宽泛、不精确,无法解决实际问题。 因此,能够真正解决社会问题的理论必须是复杂的、跨学科的。

高启琪:学科重整是肯定的。 现在的学科分工是在第二次工业革命的过程中,就像涂尔干的社会分工一样,由于新职业的诞生,产生了教育的分类,而教育其实就是为了训练劳动。 在这种逻辑下,他们越是分裂,他们就越分裂,他们就越成为工具,这就是马克思所说的异化。其中一个大模型有可能成为一个重要的使能工具,无论你在学习什么,它似乎都能帮助你,而不需要像以前那样进行分解。 从这个观点来看,它很好地回应了马克思的异化问题。 未来,每个人都应该是无所不能的,既能写诗又能写**。 使用大型模型,整个学习方法可以变成问答式。 通过百科全书式的方法,个人可以建立同步的全球学习能力。

虽然大模型不能说是一个完整的样本,但它是人类知识的一个非常大的样本,也可以说是一个世界模型。 世界上的知识基本上都是以知识压缩的形式压缩成一个大模型,人们可以根据自己的需要来称呼它。 它有什么好处?由于其样本量非常大,它可能无限接近理性。 当你遇到麻烦时,过去你只能问你的父母,问有经验的人,而更早的时候可能是通过占卜。 各种方法总是必须给你一个令人信服的理由。 从知识样本接近全样本量的角度来看,大模型给出的答案确实可能使人类个体无限接近理性。 但是,要使其解释令人信服和令人信服可能会有点麻烦。

这又回到了是否需要理论的问题,这其中还涉及两个问题。 一是**的问题。 从本质上讲,没有办法穷尽大模型的所有可能性,也没有办法做到这一点。 如果大模型真的可以做任何事情,那它就不是一个真正的开放系统,而是一个封闭的系统,有点像把所有的条件都设置好了。 但世界会很无聊。 我认为仍然有开放性。 另一个是因果关系问题。 我认为社会科学中的因果关系基本上是非常困难的。 正如《叙事经济学》所揭示的,人类社会其实是一种叙事,一个自我实现的预言,似乎很难有绝对的因果关系。

米加宁:社会科学对因果关系的追求太复杂了,有多种原因和多种结果,多种原因和不同结果。 出现这不是可以通过因果关系解决的问题。 因此,现代社会科学已经抛开了因果关系,转向了基于智能体建模的复杂系统涌现的概念,更适合社会科学对问题的看法。 大模型的出现是理论上生成的高原的建立,研究者在新的高原上建立了一个高峰。 高原和高峰的关系一定是人机协作。

人工智能时代的“人”

中国社科报:无论是以大模型为主导,还是人机协作,新技术显然在学术研究中发挥着非常重要的作用。 那么,人在其中扮演什么角色呢?这种新的研究模式对研究人员有什么要求?

Miganin:大模型的出现,需要研究者有更丰富的想象力、对全局的把控、深入的洞察。 在新技术传播的情况下,研究水平取决于个人与更大模型交谈的能力。现在最大的问题是如何标准化。 过去,美国25所学校组成的联盟反对ChatGPT,最近哈佛大学发布了在课堂上使用ChatGPT的指南。 因为它知道使用chatgpt写作业停不下来。大家都用它来,就是在高原上筑峰。

高启琪:我认为提示工程是一种短期行为。 由于大型模型的发展非常迅速,现在有了 Auto GPT,机器可以自动执行最初讨论的提示技术。

《中国社会科学报》记者:使用大模型进行学术研究,有哪些弊端或需要注意的地方吗?

Miganin:现在用它为时已晚,我还没有发现任何缺点。

高启琦:国际顶尖的人工智能研究者,比如图灵奖得主约书亚·本吉奥、杰弗利·辛顿,都非常担心人工智能的发展。 人工智能的威胁并非虚幻。 如果大型模型的样本量足够大,它将具有偏差校正功能。 但它会产生更大的两极分化效应,人们真的没有太多选择,羊群效应肯定会增加。 从这个角度来看,大模型很可能是谁当选美国的决定性因素。

中国社会科学报:ChatGPT的回答可能会影响提问者的行为或认知。

邱琳:其实对人的影响一直存在。 美国两党的两极分化在社会上非常严重,原本以为只是一些人的心声,但调查发现,现实中的人也是极度分裂的。 其实很难说是因果关系,是社会的两极分化**冲击在现实世界中,它仍然是社交的**反映现实世界。 大型模型也是如此。 它既能反映人们的思想它还会影响人们的思想。

高启琪:将成为新的战场,成为新的**指南。 我们必须看到大模型背后的资本和利益,它所代表的意识形态。 ChatGPT可以像它这样的大模型,而且有一项非常重要的工作叫做“对齐”,那就是与美国的主流价值观保持一致,否则就不会上榜了。

事实上,它对我们目前的研究人员的影响是有限的,因为我们的整个研究习惯已经形成。 但对于一个从小就生活在大模型强大影响下的未来的人来说,挑战在于他是否有信心去做自己的研究对于学术研究,人际交流至关重要。 如果技术完全占据主导地位,最终必然导致人类主体性的丧失。 在技术的主导下,人与人之间的交流会越来越弱,最终会成为技术与工艺的交流,技术将成为中心。 这其实就是马克思所说的异化。 在这样一个异化的背景下,人类肯定会走向灭绝,或者至少会衰落。虽然从庄子万物理论的角度来看,人与机器也是平等的,但在这方面讨论后人类并不符合人类的主流价值观。 毕竟机器是人发明的,即使结果是注定的。 那么为什么要加速呢?现在的根本问题是,所有国家都在加速,并希望从中受益。

相似文章

    社会科学研究伦理学

    社会科学研究伦理学 社会科学研究作为人类社会现象的一门学科,旨在揭示社会现象的本质和规律,为人类社会的进步和发展提供科学依据。然而,在人类社会现象的过程中,社会科学研究往往涉及人的隐私 权利和伦理问题,因此遵守伦理规范是社会科学研究必须遵循的基本原则。.道德规范的定义和含义。伦理规范是指社会科学研究...

    中国人文社会科学研究领域的大学新排名已经发布

    近日,教育部公布了 年度高校优秀科研成果奖的获奖情况,北京大学在人文社会科学领域的科研贡献能力和学术研究水平备受关注。哪些大学脱颖而出,它们表现出什么样的实力?让我们来看看最新的排名。根据教育部公布的数据,北京大学荣获 年度教育部优秀科研成果奖,成为人文社会科学领域的领军企业。其在该领域的学术研究水...

    社会科学研究发现,母亲和孩子更有可能在同一个月庆祝生日

    创意灵感中心 新的研究显示,在同一个月与母亲一起庆祝生日比预期的更普遍,调查了数百万个家庭的年数据。研究表明,兄弟姐妹之间以及孩子和父亲之间的出生月份也存在更高的巧合,父母之间出生月份的一致性大于预期。以前的研究发现,女性的出生季节会以某种方式影响孩子的出生季节。然而,这项发表在 人口研究 杂志上的...

    社会科学的基础范式

    社会科学作为一门研究人类社会现象的学科,其研究方法和范式对于理解和解释社会现象至关重要。社会科学的基本范式主要包括实证主义 诠释学和批判理论。这些范式中的每一种都有自己的特点,但同时也有局限性,本文将对此进行详细介绍。实证主义范式是社会科学领域最有影响力的范式之一。它主张通过观察和实验来客观地描述和...

    社会科学物理原理 (3).

    基于质量与能量的关系,社会科学的三大定律。社会科学第一定律 事物的微观属性与宏观属性相反。 资本的微观属性和资本的宏观属性 社会科学的第一定律是事物的微观属性和宏观属性是对立的。我们的传统观念。也就是说,事物的微观属性与宏观属性是一致的。相对论和量子力学之间存在冲突。如果你遵循社会科学的第一定律,就...