一360一提示您:看后求收藏(360小说网www.kevinslist.net),接着再看更方便。

在AI领域,开源已成为推动技术进步和创新的重要力量。近日,科技巨头特斯拉的创始人埃隆·马斯克再次展现了他在AI领域的雄心壮志,宣布开源其旗下AI创企xAI开发的大语言模型Grok-1。这一举动不仅使得Grok-1成为当前参数量最大的开源大语言模型,更在业界引发了广泛关注。

马斯克一直对OpenAI的开放性持怀疑态度,此次开源Grok-1可谓是对OpenAI的一次有力回应。在社交平台上,马斯克含沙射影地表示:“我们想了解更多OpenAI的开放部分。”这番言论无疑加剧了业界对于AI开源与闭源之争的关注度。

Grok-1的开源不仅意味着其模型权重和架构将遵循Apache 2.0协议向公众开放,更重要的是,它允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。这种开放性不仅有助于推动AI技术的普及和应用,更能激发更广泛的研究和创新活力。

值得注意的是,Grok-1作为一个拥有3140亿参数的混合专家(Mixture-of-Experts,MOE)大模型,其规模之大令人咋舌。相比之下,OpenAI的GPT-3.5模型仅有1750亿参数。如此庞大的参数量使得Grok-1在语言理解和生成能力上具备了强大的优势。这也意味着,要使用和测试Grok-1,用户需要拥有足够GPU内存的机器。据网友表示,这可能需要一台拥有628 GB GPU内存的机器,这无疑提高了使用该模型的门槛,但也从侧面反映了其技术含量的高度。

在Grok-1的开发过程中,xAI团队展现出了极高的技术实力和创新精神。他们首先训练了一个330亿参数的原型语言模型Grok-0,并在标准语言模型测试基准上取得了接近LLaMA2(70B)的能力。随后,他们对模型的推理和编码能力进行了重大改进,最终开发出了功能更为强大的Grok-1。在HumanEval编码任务和MMLU中,Grok-1均取得了优异的成绩,超过了包括ChatGPT-3.5在内的其他计算类模型。

与其他大模型相比,Grok-1的独特之处在于它是一款从头训练的大模型。xAI团队使用自定义训练堆栈在JAX和Rust上进行训练,没有针对特定任务进行微调。这使得Grok-1在通用性和灵活性方面具备了更高的优势。此外,Grok-1还能通过X平台实时了解世界,这使得它能够回答被大多

更多内容加载中...请稍候...

本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

其他类型推荐阅读 More+
我有一个末日网友

我有一个末日网友

奶香味哒
周安安的手机被雷劈了,恢复后微信里多出一个陌生人。本打算删掉,陌生人却发了朋友圈。4月1日,晴。空气污染严重,气温-10c。吃粥,咸鸭蛋即将耗尽。丧尸较多,不宜外出。周安安:???她来了兴致,决定配合他演
其他 连载 6万字
夸夸我的神探祖父穿越爹

夸夸我的神探祖父穿越爹

渝跃鸢飞
大理寺丞家5岁的狄昭昭,忽然听到奇怪的声音。“杀人了,好可怕!”“吁——幸好血喷到天花板上,要不然我这么漂亮的山水画就脏了。”从小听破案故事长大,正义感爆棚的崽,气得小脸通红,小钢炮一样冲出去,扯着嗓
其他 连载 26万字
24小时拯救世界

24小时拯救世界

司绘
简介:如果只有24小时用来拯救世界该怎么办? 祝施久经历了无数次的重生,回档,感受了上万次死亡时超界限的痛苦,意志在一次次死循环中濒临崩溃,穷尽了一切办法逃离却无济于事。 每次死亡都会回到那个该死的世界毁灭前一天! 他能做的,就只有抽丝剥茧寻找线索,用一次次死亡探索真相。 ——拯救世界24小时……倒计时——开始!
其他 连载 0万字
梦幻西游:二十年韭菜,杀穿神坛

梦幻西游:二十年韭菜,杀穿神坛

破印
二十周年大区梦幻西游火爆来袭,无数土豪神豪纷纷选择入驻其中。 身为韭菜的李子湘自然也不意外,但他的加入绝非为了体验游戏,而仅仅只是为了刷点梦幻币,勉强维持生计。 殊不知,刚刚创号第一天,直接激活万能合成系统。 藏宝图+藏宝图=高级藏宝图! 80环装+60环装=140未鉴定? 不仅如此,就在李子湘逐渐把一个个召唤兽投入到系统之后,轰动整个梦幻的神宠,如同流水线一样批量产出! …… 就这样,本来还挣扎
其他 连载 102万字