情感

大模型是不是太太多了？

2024-01-28 12:20:04 来源：情感

于RNN，Transformer的变革有两点：

一是用位置编码的方式取代了RNN的循环其设计，从而意味着了多处理器——这一改变大幅提升了Transformer的军事训练工作效率，从而变得并能处理大原始数据，将AI推上了大框架黄金时代；二是必要性加强了表达式的潜能。

随着Transformer多多解是决了众多不足之处，它愈来愈转演变成了NLP（文法处理）的唯一解是，颇毕竟“天不生Transformer，NLP万古如月夜”的既视感。连好几次都背弃了亲手捧上神坛的RNN，转投Transformer。

换句话说，Transformer是从前所有大框架的传奇人物，因为他让大框架从一个论点研究课题弊端，演变成了一个纯粹的建设工程弊端。

LLM较高工作效率转变树状绘单单，灰色的树上就是Transformer[9]2019年，OpenAI基于Transformer技术开发单单了GPT-2，一时近惊喜了史学圈。作为发言，Google一些公司短时近内发行了一个效能更加强的AI，叔叔Meena。

和GPT-2相对来说，Meena从未底层解是法上的革新，数数是比GPT-2多了8.5倍的军事训练模板、14倍的算力。Transformer研究课题成果作者沙泽尔对“暴力堆砌”大受震撼，差点写了篇“Meena困住在世界上”的备忘录。

Transformer的问世，让史学界的底层解是法新颖速度大幅持续上升。原始数据建设工程、算力为数、框架架构等建设工程要素，日趋成为AI竞赛的最重要胜负手，只要看似较高工作效率潜能的生物较高工作效率一些公司，都多才多艺搓一个大框架单单来。

因此，集成电路研究课题团队吴恩达在斯坦福国立大学好好演谈论时，再写道一个本质：“AI是一前传物件的子集，包括监督修习、无监督修习、加强修习以及现在的生成式集成电路系统。所有这些都是标准规范化较高工作效率，与供电和网络等其他标准规范化较高工作效率相近。[10]”

OpenAI固然仍是LLM的风向标，但导体分析的机构Semi Analysis认为，GPT-4的竞争力单单自于建设工程解是决方案——如果开放源码，任何巨头都能短时近内复现。

该分析师预定，确实用再不长时近，其他大型生物较高工作效率一些公司也能承接单单同等同GPT-4效能的大框架[11]。

建在玻璃上的内城

所想，“百模一战”已才会是一种修辞手法，而是客观现实。

就其报告近期，日和至明年7下旬，欧美国家大框架生产量已达130个，较高于美国的114个，顺利意味着爬坡爬坡，各种神话传说之前短时近不够欧美国家生物较高工作效率一些公司之前文名的了[12]。

而在贸易协定之外，一众相当富裕的国家也初步意味着了“应以一模”：除了日本国与达旦，还有印度政府促成的大框架Bhashini、大韩民国网络一些公司Ner承接的HyperClova X等等。

眼以前这阵仗，有如回到了那个漫天泡沫、“奉敕潜能”对炸的网络曾计划黄金时代。

恰巧如以前文所说，Transformer让大框架演变成了纯粹的建设工程弊端，只要有人借钱有GPU，只剩的就掉给模板。但劵虽不难花钱，也不一定意味着有为都有机有可能成为AI黄金时代的BAT。

省略写道的“类动物战争”就是个典型案例：Falcon虽然在排名上力灌入美洲驼，但不能说对Meta带来了多少冲击。

毫无疑问，跨国公司开放源码自身的科研成果，既是为了与社有可能大众分享生物较高工作效率的希冀，或多或少也努力能调度起团结北京市民的智慧。随着各个国立研究员、研究课题的机构、之前小跨国公司不断深入可用、改良Llama，Meta可以将这些成果应可用自己的商品之之前。

对开放源码大框架而言，活跃的技术开发人员群体才是其框架竞争力。

而早在2015年组建AI实验室时，Meta已定下了开放源码的主基调；扎克伯格又是靠社交媒体花掉钱发的家，更加是实是于“花钱北京市民关系”这件公事。

譬如在10下旬，Meta就专程花钱了个“AI台湾版创作音乐激励”娱乐活动：可用Llama 2来解是决崇育、生态环境等社有可能弊端的技术开发人员，将有机有可能获得50万美金的支助。

今日，Meta的Llama前传俨然已是开放源码LLM的风向标。

截至10下旬初，Hugging face的开放源码LLM音乐榜Top 10之前，共有8个都是基于Llama 2所承接的，均可用了它的开放源码协议。数在Hugging face上，可用了Llama 2开放源码协议的LLM之前大达了1500个[13]。

日和至10下旬初，Hugging face上排名第一的LLM，基于Llama 2承接当然，像Falcon一样提较高效能也未尝不可，但今日，市面上大多数LLM仍和GPT-4有着肉眼可见的效能落差。

例如以前些时侯，GPT-4就以4.41分的学业成绩勇夺AgentBench的测试领头羊。AgentBench标准规范由清华国立大学与特拉华州立国立大学、加州国立大学伯克利分校都由发行，可用指标LLM在多维度开放式生成生态环境之前的推理潜能和决断潜能，的测试内容包括了虚拟机、原始数据库、常识绘单单谱、卡牌对战等8个不同生态环境的任务。

的测试结果近期，第二名的Claude数有2.77分，落差仍相当明显。至于那些声势浩大的开放源码LLM，其的测试学业成绩多在1分上下游走，还大概GPT-4的1/4[14]。

AgentBench的测试结果要告诉他，GPT-4发布新闻于明年3下旬，这还是当今在世界上曾和逃跑了大半年之后的学业成绩。而带来这种落差的，是OpenAI“智商反射率”极好的研究课题团队团队与长期研究课题LLM积累依然的经验，因此可以自始至终遥遥领先。

也就是说，大框架的框架潜能不一定是模板，而是生态环境保护的建设（开放源码）或纯粹的推理潜能（竞争者）。

随着开放源码乡村日趋活跃，各个LLM的效能可能有可能趋同，因为大家都在可用相似的框架架构与相似的原始数据集。

另一个更加直觉的根本原因是：除了Midjourney，似乎还从未哪个大框架能花掉到钱。

实用价值的锚点

明年8下旬，一篇题为“OpenAI可能有可能于2024年底破产”的奇文引致了不少关注[16]。社论主旨大部分能用一句话总括：OpenAI的烧钱速度太短时近了。

社论写道，自从技术开发ChatGPT之后，OpenAI的有余损恰巧短时近内拓展，数2022年就有余了达5.4亿美元，必需等着Google一些公司股票给钱。

社论末尾虽耸人听闻，却也谈论单单了一众大框架互联网服务的现状：技术开发成本与年收入导致不均。

更加为昂贵的技术开发成本，导致目以前借助于集成电路系统花掉了大钱的只有英伟达，顶多再加个博通。

据咨询一些公司Omdia预估，英伟达在明年二季度卖单单了的大30万块H100。这是一款AI芯片，军事训练AI的工作效率奇较高无比，当今在世界上的生物较高工作效率一些公司、科研的机构都在抢购。如果将卖单单的这30万块H100叠在一起，其总重量约等于4.5架波音747飞机[18]。

英伟达的获利也顺势起飞，同比获利暴涨854%，一时近惊掉了华尔街的脖子。因由一提，目以前H100在二手市场的价格已被水煮到4万~5万美金，但其物料技术开发成本数有达3000美金单单头。

昂贵的算力技术开发成本之前在不太可能上成为了从业者转变的空气阻力。雪松储蓄曾好好过一笔估测：当今在世界上的生物较高工作效率一些公司每年预定将花费2000亿美金，可用大框架基础公共设施建设；相对来说之下，大框架每年最多必需显现出750亿美金的年收入，之前近共存着至少1250亿美金的缺口[17]。

另外，除了Midjourney等少数个例，多数软件一些公司在付单单了极大的技术开发成本后，还说什么清楚怎么花掉钱。特别是在是从业者的两位声言哥哥——Google一些公司和Adobe都走得有些踉跄。

Google一些公司和OpenAI曾合作技术开发了一个AI代码生成物件GitHub Copilot，虽然每个下旬要收10美元下旬费，但由于公共设施技术开发成本，Google一些公司反而要拉到有余20美元，重度浏览器甚至能让Google一些公司每下旬拉到贴80美元。以此推论，单价30美元的Microsoft 365 Copilot，花钱不好有余的更加多。

无独有偶，刚发布新闻了Firefly AI物件的Adobe，也短时近内团购了一个配套的负数系统，不必要浏览器重度可用带来一些公司有余损。一旦有浏览器可用了大达每下旬分配的负数，Adobe就有可能给服务回转。

要告诉他Google一些公司和Adobe之前是跨国公司过场完整，拥有大量现成上网浏览器的软件巨头。而多数模板堆神的大框架，最大的运用于过场还是聊天。

毫无疑问的是，如果从未OpenAI和ChatGPT的横空单单世，这场AI武装革命确实灌入根不有可能暴发；但在所想，军事训练大框架所造就的实用价值却说得打一个问号。

而且，随着同质化竞争加剧，以及市面上的开放源码框架愈来愈多，留下其实的大框架客户的空近确实有可能多于。

iPhone 4的更加是不是因为45nm元件的A4处理器，而是它可以游玩寄生植物一战梦魇和生气的小鸟。

参考资料

[1] LLM Leaderboard Gone Wrong，Analytics India Mag

[2] NEC借此机会の大規模言語モデル（LLM）開研の裏側に迫る

[3] Spread Your Wings： Falcon 180B is here

[4] Abu Dhabi throws a surprise challenger into the AI race，The Economist

[5] TIME 100/AI

[6] OpenAI暗藏的Ilya Sutskever：一个集成电路视觉效果、方法学、单人游戏和机器人人的变革者，机器人之心

[7] 深度修习解是法转变：从多种不同到为统一，国金证券

[8] Your AI Friends He Awoken， With Noam Shazeer，No Priors

[9] Harnessing the Power of LLMs in Practice： A Survey on ChatGPT and Beyond，Jingfeng Yang、Hongye Jin等

[10] Andrew Ng： Opportunities in AI - 2023，Stanford Online

[11] GPT-4 Architecture， Infrastructure， Training Dataset， Costs， Vision， MoE，Semi Analysis

[12] IT 2023，赛迪顾问

[13] Open LLM Leaderboard，Hugging face

[14] AgentBench： Evaluating LLMs as Agents，Xiao Liu， Hao Yu等

[15] Who Owns the Generative AI Platform，a16z

[16] OpenAI Might Go Bankrupt by the End of 2024，Analytics India Mag

[17] AI’s $200B Question，Sequoia

[18] Nvidia Sold 900 Tons of H100 GPUs Last Quarter， Says Analyst Firm，tomshardware

[19] Character.ai‘s Noam Shazeer： “Replacing Google - and your mom”，Danny In The Valley

。

消食药
科兴抗病毒治疗用药
睡觉老打呼噜吃什么能治好
胃反酸怎么解决
婴儿吃什么治疗腹泻

TAG：模型

上一篇：神回复：这是我亲爸吗？就让说我像风尘女子，网友评论太扎心，哈

下一篇：私交混乱上位，与男黑人酒馆贴身热舞，连魏大勋都难逃魔爪？

大模型是不是太太多了？

27岁网红被曝突发病身故！仅留爷爷奶奶在家，众好友发文惋惜

翼支付旗下子公司甜橙保险代理两宗违法违规被罚

青岛红建投资30亿元私募项目状态预览为“已反馈”

Fanbook这款工具能为游戏用户运营带给怎样的新思路？

设计团队揭秘初春残奥会吉祥物形象创作万余张修改稿“堆”出雪容融

大模型是不是太太多了？

27岁网红被曝突发病身故！仅留爷爷奶奶在家，众好友发文惋惜

翼支付旗下子公司甜橙保险代理两宗违法违规被罚

青岛红建投资30亿元私募项目状态预览为“已反馈”

Fanbook这款工具能为游戏用户运营带给怎样的新思路？

设计团队揭秘初春残奥会吉祥物形象创作 万余张修改稿“堆”出雪容融

设计团队揭秘初春残奥会吉祥物形象创作万余张修改稿“堆”出雪容融