当谈到大型语言模型 (LLM) 的智能时,我们经常听到这样的想法,即当 LLM 通过下一个令牌预测 (NTP) 任务进行训练时,它们实际上是在对数据进行无损压缩。 这种观点认为,LLM能够准确地写出下一个单词,从而在不丢失任何信息的情况下压缩数据。 但是,这种观点可能并不完全准确。
首先,让我们回顾一下无损压缩的概念。 在数据压缩中,无损压缩是指压缩后的数据可以完全恢复到其原始状态,而不会丢失任何信息。 对于LLM,这意味着当下一个单词被制作时,模型能够完全准确地恢复到原始文本。
然而,当我们深入挖掘时,我们发现这个“无损”标签可能有点过于乐观了。 虽然LLM确实能够在训练过程中通过NTP任务学习文本的深层结构,但当模型应用于现实世界时,它并不总是能够完美地放置一个单词。 这个错误实际上代表了信息的丢失,因为原始文本中的某些信息没有正确地传递给下一个单词。
那么,我们如何解释这种信息丢失呢?事实上,LLM在**过程中的这种“有损”压缩是通过算术编码来补偿的。 算术编码是一种高效的数据压缩技术,它通过将连续的实数映射到有限范围的整数来实现数据压缩。 在 LLM 过程中,如果出现错误,算术编码会通过额外的编码来补偿这种信息丢失,从而使整体外观为无损压缩。
所以,当我们说LLM能够进行“无损压缩”时,我们实际上是在说“LLM+算术编码”系统能够进行无损压缩。 该系统协同工作,通过LLM的能力和算术编码的补偿机制实现无损压缩。
总的来说,LLM的数据压缩能力是其智能的一个重要方面,但在这个过程中,我们需要更准确地理解什么是“无损”和“有损”。 LLM可以借助算术编码,在一定程度上补偿**误差造成的信息丢失,实现数据的有效压缩。
优质作者名单
相似文章
JD 法学博士 和LLM 法学硕士 是两种不同类型的法律学位,区别主要在于习学习的内容 学位类型和学习习的方式。JD是Juris Doctor的缩写,是法学学位的一种,是美国本科毕业生申请法学院的主要学位。法学博士课程主要包括法学研究方法 法学理论 法律实务 法律伦理 宪法 诉讼等课程,旨在培养学生...
美国月非农就业人数增长 ,人高于预期,失业率回落至 但考虑到本周宣布的 月 Jolts 职位空缺为 个万人,为近两年半以来的最低水平,月就业好于预期,可能主要是由于月罢工影响消除,就业供需紧张格局缓和趋势维持不变。非农就业人数好于预期,金价 并未改变长期趋势。此外,月中国外汇储备继续增加 外汇储备为...
展示新的 GPT API 引入了新的漏洞。这些漏洞违反了 GPT 中的安全措施,导致 GPT 协助用户发出有害请求。此外,这些漏洞可用于自动生成有针对性的和通用的虚假信息 泄露私人数据 生成恶意 以及与 GPT 集成的攻击服务。实验中使用的数据集可供采集。这些结果强调了仔细测试新 API 的必要性 ...
离合器压力是驾驶汽车时的一项重要技能,对于驾驶手动变速箱车辆至关重要。以下是离合器稳定的一些技巧 .压力控制 确保对离合器踏板施加适当的压力。轻轻均匀地踩下离合器踏板,不要太用力或突然。当您感觉到踏板底部时,感觉离合器完全松开,但不要过度踩压。.运行缓慢 离合器上的压力需要逐渐释放。起步或换档时,慢...
这些建议提高了 LLM 申请的准确性,并包括如何选择正确的 LLM 的注意事项。翻译自 Adrien Truille 的 个关键技巧,用于构建更好的 LLM 驱动的应用程序,她是 Snowflake 的产品管理总监兼 Streamlit 负责人,负责数据云的可视化数据产品和 Streamlit 计划...