206 316 本文约1400字 预计阅读时间5分钟 自从ChatGPT风靡全球以来,人工智能重新获得了大家的关注。 作为人工智能领域的产品设计师,我自然一直在关注这个领域的发展。 最近,我读完了丁磊博士写的《生成式人工智能》一书,通过这本书,我把书中的想法分享出来,给出自己的理解,让读者朋友熟悉起来。
作者丁磊不是网易的丁磊,而是另一个同名同姓的人:前金融首席数据科学家,前PayPal科学数据科学部门负责人。 他还拥有俄亥俄州立大学的人工智能博士学位。
在了解生成式人工智能之前,我们可以先将当前主流的人工智能技术分为两类,即决策人工智能和生成式人工智能。
具体区别如下表所示
首先,对于决策AI,书中是这样解释的:
决策AI(又称判别式AI)学习数据中的条件概率分布,即样本属于特定类别的概率,然后对新的场景进行判断、分析、分析。 决策AI主要有几个应用领域:人脸识别、推荐系统、风控系统、其他智能决策系统、机器人和自动驾驶。简单来说,现在的人工智能模型就是一个公式,而这个函数有什么参数,比如如何识别猫狗,通过逻辑推导,几乎没有办法知道这个公式的参数,那么就需要提供大量的猫狗来训练这个AI模型, 告诉它猫狗应该是什么样子,让计算机自己学习,提取特征,而这就利用了脑科学和计算机科学相结合的概念,通过模拟大脑神经元的机制,构建了一个基于深度学习的人工神经网络,并通过不断喂它来训练**或**,AI模型越来越意识到如何识别猫和狗, 从而变得像人类一样准确。人类花了数百万年的时间才学会了快速识别猫和狗的能力,其他人也是如此。 计算机通过对它们进行数字训练来赶上这种识别能力。例如,在人脸识别领域,决策AI从实时获取的人脸图像中提取特征信息,然后将其与人脸数据库中的特征数据进行匹配,以实现人脸识别。
特定识别产生特定的人工神经网络实现,例如,通常使用目标检测来识别猫和狗,实现基于卷积神经网络的YOLO系列。 决策AI通常是一个小模型,通过少量的数据训练,可以快速获得一个特定领域的识别模型,但它只能做好一件事。
另一方面,生成式人工智能除了仍然使用深度学习模型来训练概念外,还具有生成新内容的能力。 最先爆发的是LLM,一个大型语言模型,它通过向人工智能提供大量的人类书籍、知识等数据,通过算法重组知识,训练出一个拥有各行各业知识的模型,而所谓的计算机重组就是对每个单词的下一个单词进行条件概率统计, 从本质上讲,统计学。例如,如果你问它,谁是中国历史上的第一位皇帝? 它会把你说的每一个字都听懂,然后通过它掌握的知识库,找到相似词的下一个词的概率,比如找第一个皇帝是秦国,第二个字是开头的概率更高,第三个字是皇帝的概率还是很高的, 并且可以继续拓展内容,不断填充秦始皇的生平和事迹。这与搜索引擎不同,搜索引擎只在海量数据库中查找相应关键字的网页和文本,并且只能在数据库中找到其中的一部分。 另一方面,生成式人工智能可以理解为分解所有知识并随意组合,使其具有编造故事的能力,前提是您告诉大型语言模型您希望它做什么,定义其身份,并且不要传播到没有边界的地步。 如果问医学知识,就告诉它扮演医生的角色,这样它就可以重新聚焦分散的知识库,对医学相关知识进行分类和重组。
同理,对于AI生成来说,就是把每个字符拆解,换成拆解每个字符的像素,计算相邻像素的概率分布,从而根据文本或输入得到一个新的**。
基于时间关系,今天就从更多的内容开始,接下来的几天再慢慢说。 如果您对人工智能有任何疑问,欢迎留言讨论和学习。 更多内容,欢迎关注微信*** 吴岩沉默0123下方,可以再欣赏几幅AI生成的画作,创作工具包括:Midjourney、上堂二画、阿里通义万象、文心一格等,有时候感觉生成式AI画就像盲盒游戏,就算限定提示词, 每次生成还是不一样的**,可以是真的,是独一无二的,这是它的魅力之一: 提示词:人工智能,识别猫,狗,一切,人类从中受益,杰作,细节丰富,品质上乘
更多商汤科技与阿里通艺使用相关资讯,请参考文章:
国产AI绘图工具大PK:商汤科技第二幅画,阿里通义万祥和文心一歌,谁的绘图效果更惊艳?
更多文心一格使用方法,请参考文章:
推荐一款免费且易于使用的 AI 绘图神器。