首页 > 资讯列表 >  本页面生成但是想要变强也不是那么简单专题报道,但是想要变强也不是那么简单滚动新闻,但是想要变强也不是那么简单业界评论等相关报道!
  • 数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩

    数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩

    克雷西 发自 凹非寺量子位 | 公众号 QbitAI对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。而ChatGPT与单纯统计预测的区别,可以做这样的类比:如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。什么是“随机鹦鹉”一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big这对过去的语言模型,或许确实成立。比如曾经流行的n-gram算法。比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…不难看出,随着n值的升高,文本越来越接近人类语言。而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。GPT-4不只是“随机鹦鹉”要证明这一点,可以先看下棋机器人的例子。如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。那它就能通过“背谱法”模仿其他任何棋手或程序的下法比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。所以Stockfish肯定是通过更高级的方法来实现下棋的。人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。仅在是上一代的GPT-3的token字典中就有超过5万token。如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。届时,需要存储的情景数量将达到50000^8000。正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。“随机鹦鹉”达不到的高度仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。第一个实验关于一道经典的农夫过河问题。一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。狼、羊和菜则分别换成火星人、金星人和月球人。替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。回答中使用的句子,也无法在互联网中被检索到。这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。第二个实验则是数字排序。如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?其实只要从GPT的输出当中就可以看出来了。假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。更不必说GPT-4了。参考链接:https://jbconsulting...

    智能设备 2023-05-27 16:02:19
  • 如果我国在芯片领域完全突破了,那么会不会在科技局全球无敌了?

    如果我国在芯片领域完全突破了,那么会不会在科技局全球无敌了?

    如果,连芯片都突破了,中国是不是无敌了?半导体研究机构IC Insights公布最新的芯片市场研究报告显示,2021 年,美国公司占据了全球芯片市场销售总额(包括IDM和Fabless厂商的芯片销售额的总和)的 54%,而中国大陆占比仅有4%。突破芯片封锁并不意味着中国无敌了...

    手机互联 2023-05-18 10:06:08
  • 荣耀90系列外观被曝还是那么美

    荣耀90系列外观被曝还是那么美

    荣耀90系列的真机图现身。荣耀90系列两款手机在设计语言上延续了荣耀80系列的风格,仅在后壳工艺等方面做出了部分调整。尤其是在荣耀90 Pro上,还是那么美,而且还有着标志性的辨识度。据悉荣耀90系列顶配机型将会搭载高通骁龙8+芯片,采用1.5K高频调光居中双孔曲面屏,搭载2亿主摄,影像略微有加强。同时,新机将会汲取荣耀80系列的一些用户反馈进行重点升级。 ...

    手机互联 2023-05-17 08:53:59
  • 同样都是4nm工艺,台积电为什么会比三星强那么多?

    同样都是4nm工艺,台积电为什么会比三星强那么多?

    台积电和三星都是全球领先的芯片制造商,它们都采用了4nm工艺,但为什么台积电会比三星强那么多?让我们来深入了解一下!首先,我们需要了解什么是4nm工艺。4nm工艺是一种芯片制造技术,它可以让芯片变得更小、更快、更省电...

    智能设备 2023-05-13 10:26:01
  • MIUI升级Android14!小米13抢先刷机:不是毛坯走心了!

    MIUI升级Android14!小米13抢先刷机:不是毛坯走心了!

    快科技5月12日讯,本周,基于Android 14 Beta1的MIUI 14开发预览版上线,首批支持小米13、小米13 Pro和小米平板6三款机型,目前刷机包和刷机教程已公布。有国内网友体验后发现,今年的公测版不再是原生安卓,而是MIUI ROM,不过,毕竟是开发者预览,很多本地化并未到位,另外,系统流畅度不高。其它变化还有,扩展内存功能无法使用,返回手势预览不可用、已用内存显示不正确等。此次小米13的版本号为MIUI 14 23.5...

    手机互联 2023-05-13 09:34:49
  • 价格不是问题iPhone14Pro成最畅销手机

    价格不是问题iPhone14Pro成最畅销手机

    苹果公司发布2023年第一季度财报,数据表现令人惊喜。据市场研究机构CIRP最新报告,苹果手机平均售价为988美元(约6837元人民币),同比增长12%,显示出其在高端市场的强势地位...

    手机互联 2023-05-05 08:48:27
  • 换了C口也不受限!iPhone15猛料曝光:充电功率没变化

    换了C口也不受限!iPhone15猛料曝光:充电功率没变化

    4月28日,科技媒体iMore曝光了一则关于iPhone15的新消息,其中提到了新接口的部分信息,更换了全新USB-C接口的iPhone15系列,将不会有MFi协议限制,这也就意味着,它能正常使用市面上大部分USB-C接口的数据线进行充电。但值得注意的是,iPhone15系列充电功率最高仍是27W,与前代保持一致...

    手机互联 2023-04-28 16:18:48
  • 不让三星独美索尼1亿像素传感器来了:可惜不是1英寸大底

    不让三星独美索尼1亿像素传感器来了:可惜不是1英寸大底

    快科技4月23日消息,手机拍照传感器有2个技术方向,一个是高像素,一个大底,三星选择了前者,不仅推出了1亿像素,2亿像素的传感器都有了,而索尼选择了大底,1英寸大底传感器已经成为三大旗舰机标配。但是索尼的1英寸传感器IMX989只有5000万像素,相比1亿、2亿像素传感器在营销上是吃亏的,日前有消息称索尼也搞出了自己的1亿像素传感器(准确来时是1.08亿),型号为IMX802,但它不是1英寸大底,而是1/1.33英寸的...

    手机互联 2023-04-24 08:35:24
  • 苹果发布会定档,iOS17将至,快看看你的iPhone是不是被抛弃了

    苹果发布会定档,iOS17将至,快看看你的iPhone是不是被抛弃了

    苹果公司宣布于今年的6月份举行发布会,届时将会推出最新的iOS17系统,这意味着很多iPhone用户可能将失去升级这一新版系统的机会。据悉,iOS17将只支持2020年及以后发布的iPhone型号,如果您的设备是旧款iPhone,那么您可能已经被抛弃了...

    手机互联 2023-04-23 08:55:11
  • 亚马逊开始裁减广告业务部分员工,能赚钱也不能幸免

    亚马逊开始裁减广告业务部分员工,能赚钱也不能幸免

    亚马逊周二确认,开始裁减广告业务部分员工,CEO安迪·贾西(AndyJassy)仍在努力削减成本。亚马逊的广告、IMDb和GrandChallenge高级副总裁保罗·科塔斯(PaulKotas)通知员工裁员情况,但目前还不清楚广告部门裁员人数的具体情况...

    业界动态 2023-04-20 21:03:17
  • APUS创始人李涛:“中国人工智能落后绝不是两个月,起码两年以上”

    APUS创始人李涛:“中国人工智能落后绝不是两个月,起码两年以上”

    文/闫妍4月18日,APUS发布自研多模态人工智能大模型“AiLMe”。AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力,并推出“智能问答大师、简笔成画、墨染、DailyAstro、StarNight、KJVBibleNow、PicPik”等系列AI产品...

    互联网 2023-04-20 21:02:37
  • OpenAICEO:公司目前没有训练GPT-5,短期内也不会训练

    OpenAICEO:公司目前没有训练GPT-5,短期内也不会训练

    4月14日消息,OpenAICEO萨姆·奥尔特曼(SamAltman)近日确认,公司目前没有训练GPT-5,并且“短期内也不会训练”。GPT-5被认为是GPT-4的继任者,后者是OpenAI今年三月发布的大语言模型...

    业界动态 2023-04-14 22:41:34

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持