OpenAI公开破解GPT

资讯 2024-06-09 阅读:68 评论:0
OpenAI研究如何破解GPT-4思维,开放超级部分团队的工作,Ilya Sutskever在提交人的名单上。    该研究提出了改进大规模稀释编码器培训的方法,并成功地将GPT-4内部表解为1 600万可理解特征。 因此,关于复杂语...
美化布局示例

欧易(OKX)最新版本

【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   全球官网 大陆官网

币安(Binance)最新版本

币安交易所app【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址

火币HTX最新版本

火币老牌交易所【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址

OpenAI研究如何破解GPT-4思维,开放超级部分团队的工作,Ilya Sutskever在提交人的名单上。

  

该研究提出了改进大规模稀释编码器培训的方法,并成功地将GPT-4内部表解为1 600万可理解特征。

因此,关于复杂语文模式的内部工作变得更加容易理解。

  

事实上,早在六个月前,研究就开始了:

  

OpenAI公布时, 前超隔离小组的成员和论文提出并分享:

我们采用了一个新的基于TopK激活功能的远程编码器培训平台,消除了功能减少,并允许直接设定L0。

我们发现这种方法在平均差幅/L0边界上效果良好,即使规模为1 600万,也很少损失潜在单位(延时单位)。

  

Ilya Alliance Jan Leike(RLHF发明者之一,

这是一大进步! 分裂编码器是目前真正理解模型内部思维的最佳方法。

  

更有趣的是,人类学最近 派了类似的工作。

从Claude 3.0 Sonnet中间层成功提取了数百万个地物,提供了其计算内部状况的广泛概念图。

  

所以他们中有些人驾驶小麦,工作牛, 但是OpenAI不是有点太焦虑, 论文没有指向Arxiv, 分析似乎没有走那么远。

这是对人类的研究和Jan Leike的离开的回应吗?

  

回到重点,OpenAI超级和解小组 是如何找到如何打破GPT -4思维的?

见OpenAI新出版的研究报告Ilya的名字。

目前,语言模式神经网络的内部工作原则仍然是一个 " 黑盒 ",不能完全理解。

为了理解和解释神经网络,首先必须找到可用于神经计算的基本构件。

鹅,神经网络中的激活,通常显示不可预测和复杂的模式,而且几乎总是每次进入都触发非常密集的激活。 在现实世界中,它是薄的,在任何特定情况下,只有人类大脑中相关神经元的一小部分被激活。

  

因此,研究人员开始研究编码器的稀释问题,这种技术在神经网络中发现对产生某一特定产出至关重要的几个 " 特征 ",类似于人们在分析问题时脑中至关重要的那些特征。

它们的特性呈现出稀有的激活模式,这些模式自然与人类易于理解的概念相吻合,即使没有直接的解释性激励。

然而,现有的培训稀有编码员的方法面临着重建问题,在大规模扩张中,交易越少,失败的可能性就越大等等。

在OpenAI超级调整小组的这项研究中,他们采用了一个新的基于TopK激活功能的远程编码器(SAE)培训平台,消除了特征减少问题,并直接设定L0(直接控制网络中的非零激活次数)。

该方法在平均差错(MSE)和L0评估指标方面表现极佳,尽管在1 600万规模的培训中,该方法几乎没有损失潜在单位(延迟)。

具体而言,它们使用GPT-2小型和GPT-4系列模型的碎片流作为其编码器的输入器,选择网络深层(接近产出层)的碎片流,如GPT-45/6层和GPT-2小8层。

并使用先前工作中提出的ReLU 基线自编码器结构,编码器可以通过雷LU的激活获得稀释潜伏兹,而解码器则从兹重新生成碎片流。 损失功能包括重建MSE损失和L1, 用于促进潜伏薄度。

  

小组然后提议使用TopK激活功能,而不是传统的L1。TopK仅保留编码器前引爆器上的最大K值,留下零,从而直接控制低空 k。

  

L1不需要L1,L1引起的激活收缩已被避免。实验表明,TopK在重新建立质量和薄度之间比ReLU等激活功能之间有一个更好的权衡。

  

此外,大量潜伏物在从编码器接受培训后随时被激活(实时),导致计算资源的浪费。

团队解决办法包括两项关键技术:

初始化编码器重量为要转换的解码器重量,以便在初始化时可以激活潜值。

添加辅助重建损失项,以利用损失的顶层潜伏物模拟重建损失。

所以即使是1600万个 平坦质量自我记录 也有7%的失败率。

该小组还提议改进 " 顶级 " 多重损失功能,在高薄度情况下提高一般化能力,并探讨两种不同的培训战略对潜伏数量的影响,在这方面,这种影响并不太大。

  

为了证明该方法的可缩放性,小组培训了一个薄编码器,配有上述1 600万平板,并加工了40亿个GPT-4模型启动时的标记。

GPT-4进程启动40亿面值

其次,评估编码器质量的关键在于所提取的特征是否对下游应用有用,而不仅仅是优化损失和薄度的重建。

因此,小组提出了评估自我编码系统质量的若干新方法,包括:

下游损失(下游损失):评估潜伏对编码器重新创造的语言模型的性能的影响。

测试损失:检查自编码器能否恢复我们认为可能找到的特征。

解释性:评估能否通过简单和精确的解释来理解自我编码潜伏的引爆。

消除稀有现象:评估消除个别潜伏对下游预测的影响。

实验发现,TopK自编码器的自下而上的损失比重建MSE的情况有所改善。

  

随着潜伏物数量的增加,探测损失有所改善,但在一些地区,探测损失将上升和下降。

  

此外,研究人员发现,当潜伏物数量大,稀释物数量少时,准确性和召回率是最佳的。

  

TopK模式的召回率高于RELU模式,并且能够更好地抑制假引爆。

  

分解混杂性(见上文图6b),小组发现自我编码潜值的影响比直接稀释矢量小,但是,当宽度K太高时,效果较小。

最后,编码器稀释问题还远未解决,本研究中,SAE只捕捉到GPT-4行为的一小部分,即使它看起来是单一的,其潜伏也难以准确解释。 而且,从精细的 SAE到更好地了解模型行为,还需要做很多工作。

关于这项研究的更多详情,有关家庭成员可查看原始文件。

OpenAI还公开公布GPT-2的完整源代码和多个小型自编码模型重量,还有一种在线可视化工具来查看多种模型的启动功能,包括1 600万平板GPT-4自编码器。

OpenAI: https://cdn.openai.com/papers/sparse-autoencoders.pdf。

人类学:https://transexen-电路.pub/2024/scaling-monosemantics/index.html。

链接到引用 :

  [ 1 ] https://x.com/OpenAI/status/1798762092528586945

  [ 2 ] https://openai.com/index/extracting-concepts-from-gpt-4/

  [ 3 ] https://news.ycombinator.com/item?id=40599749

  [ 4 ] https://x.com/janleike/status/1798792652042744158

  [ 5 ] https://openaipublic.blob.core.windows.net/sparse-autoencoder/sae-viewer/index.html

美化布局示例

欧易(OKX)最新版本

【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   全球官网 大陆官网

币安(Binance)最新版本

币安交易所app【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址

火币HTX最新版本

火币老牌交易所【遇到注册下载问题请加文章最下面的客服微信】永久享受返佣20%手续费!

APP下载   官网地址
文字格式和图片示例

注册有任何问题请添加 微信:MVIP619 拉你进入群

弹窗与图片大小一致 文章转载注明

分享:

扫一扫在手机阅读、分享本文

发表评论
平台列表
美化布局示例

欧易(OKX)

  全球官网 大陆官网

币安(Binance)

  官网

火币(HTX)

  官网

Gate.io

  官网

Bitget

  官网

deepcoin

  官网
热门文章
  • DDO在新加坡上市真假,欧意交易所能交易数字期权吗?

    DDO在新加坡上市真假,欧意交易所能交易数字期权吗?
    然而,对于DDO在新加坡的列名是否真实存在争议。 据报道,有人质疑DDO的数字选项是否真的上市,其背景是否经过了彻底调查。 首先,有报告说,DDO数字选项清单仅仅是一种宣传手段,没有找到DDO交易的平台,这就对DDO的真正清单提出了疑问。 其次,一些媒体调查了DDO数字选项的背景。 报告显示DDO数字选项发行人声称其数字选项是国家赞助的,但实际上,根据中国人民银行,虚拟货币相关业务是非法金融活动。 此外,DDO数字选项在视频号码等平台上广为传播,吸引了许多信徒的注意,然...
  • Griffin Gaming Partners计划为其第三支基金筹集5亿美元

    Griffin Gaming Partners计划为其第三支基金筹集5亿美元
    Pitchbook引用的6月8日《快链头条新闻》作为监管文件, 指出游戏风险投资公司Griffin赌博伙伴计划为其第三个旗舰基金筹集5亿美元, 比第二个基金少33%。 2021年,格里芬赌博伙伴从Web3游戏开发者Forte获得A回合资金1.85亿美元,并于2022年筹集了第二个旗舰基金,金额达7.5亿美元,此时风险资本家对Web3和加密游戏的热情达到顶峰。...
  • 加密货币之王重回王位:比特币飙升至 71,000 美元,还能再涨多少?

    加密货币之王重回王位:比特币飙升至 71,000 美元,还能再涨多少?
    比特币是市场上最大的加密货币,它再次打破了重要的7万美元门槛。 在短短的四舍五入(67,000美元到69,000美元之间)之后,价格在这一水平上遇到了强烈的抵制。 然而,势头的不断增强表明,比特币可能形成一个超过70 000美元的板块,为重新测试下一个抵抗阵地71 300美元和3月份可能攀升到历史最高点73 700美元铺平了道路。 问题仍然是:比特币能否维持预期的上升趋势并继续大幅上升?    分析家预计比特币价格将上升到74,400美元。 加密货币分析师Ali M...
  • 比过山车还狠!比特币价格再次暴跌

    比过山车还狠!比特币价格再次暴跌
      上周日,比特币的价格创造了3000美元的历史新高,随后就开始各种高台跳水了。Last Sunday, the price of Bitcoin created a record high of $3,000, and then began to dive on all the high platforms.   据外媒报道,本周一,比特币价格一度下跌到2526.4美元,最高跌幅高达14.5%,这创造了2015年1月以来最大跌幅。According to external...
  • 几张图看懂区块链技术到底是什么?https://www.cnblogs.com/behindman/p/8873191.html

    几张图看懂区块链技术到底是什么?https://www.cnblogs.com/behindman/p/8873191.html
    “区块链”的概念可以说是异常火爆,好像互联网金融峰会上没人谈一谈区块链技术就out了,BAT以及各大银行还有什么金融机构都在开始自己的区块链研究工作,就连IBM最近也成立了自己的区块链研究实验室,但其实区块链到底是什么?大家或许并不清楚,停留在雾里看花的状态。从今天开始,就让我们一起走进区块链,揭开区块链的神秘面纱吧!The concept of a block chain can be described as an unusually hot one, as if no...
标签列表