Grok即将上线!马斯克据此成为“数据封建王”?

作者:小岩

11月24日,马斯克在X上发文,表示所有初代特斯拉Roadster的原始设计和工程现在完全开源。不单如此,旗下的AI大模型Grok将于下周正式上线。Grok的上线具有十分重要的里程碑意义。因为这件事刚好发生在ChatGPT发布一年之际,短短一年时间,生成式AI得到了长足的发展,成为了具有确定性的技术浪潮。

经过数十亿条数据训练,达到高效与省时的目的。

据了解,Grok有两种模式供选择,即普通模式和有趣模式。在有趣模式下,Grok会赋予 AI更多的智慧和幽默,使它成为一种独特有趣的聊天机器人。

相较于其他的AI模型,Grok具备一项得天独厚的优势:可以通过获取实时新闻和推特的方式快速获取最新信息和趋势。也正因此,Grok会以极其简洁的方式为自己的用户提供最新的新闻摘要,这会为用户节约掉大量的时间,这在同类AI产品中是极具核心竞争力的。

此外,Grok经过了数百万条推文和线程的训练,拥有出色的写作能力,它的推文和线程的见解可能会比大多数人写的更好。

Grok的发展速度相当之快。今年7月,xAI迅速训练出了Grok-0这一基础模型,随后进行了调优,进化成了 Grok-1。这个模型的参数虽然只有大约330亿,但是能力已经超过llama2 70B 和GPT-3.5。

​马斯克背刺Open AI,即将成为“数据封建主”?

很多人觉得马斯克在此时推出Grok,会对OpenAI形成较大的威胁。究其原因,不难理解,因为Grok拥有重要的人类数据。如今的大模型数据相当吃紧,就连生成式AI的鼻祖OpenAI都不得不直接拿自己用户的数据来进行训练。

在这种情况下,背靠X这一庞大的社交平台,Grok就拥有了体量巨大,而且会不断更新的数据库,这是一张分量十足的王牌。

不过,正如硬币都有正方面,X所坐拥的海量数据也是双刃剑般的存在。作为一个大型社交平台,X上面的大部分数据都未经核验,质量肯定是参差不齐的。数据未经筛选,就直接拿来训练大模型,很难保证Grok所提供内容的质量。

所以,有业内专业人士分析,尽管马斯克财大气粗,但在AI这一赛道上,他能进步的空间是有限的,最多只能成为割据一方的“数据封建主”。

那么,什么是数据封建主?

简单来说,就是以独有数据为基础,在某些垂直的行业和领域内“圈地为王”,争取做到极致。这个概念最初由希腊前财政部长雅尼斯·瓦鲁法克斯提出,他在目睹了欧洲各国被美国科技企业多次压榨和盘剥之后,得出了这样的结论。如今,应用层的路逐渐被GPTs堵死了,这种靠独有数据圈地为王的方式或许成了其他企业杀出重围的唯一途径。Grok以X平台的数据做基础,似乎是在往新一代数据封建主的方向发展。

这样的做法会在短期内取得成绩,但不是长久之计。因为所谓的“独有数据”看似是坚不可摧的壁垒,但势必会随着技术的发展不断被削弱,以至于被更强的通用模型步步蚕食。

这一点我们普通人都想得到,马斯克一定不会忽略。相比起单纯数据封建主,马斯克的Grok已经展示出了解决这一问题的潜质和能力。

马斯克曾经在访谈中盛赞中国的微信,他认为微信是一个很好的样本,拥有很棒的接口和APP,因为在中国你几乎可以“生活在微信里”。

值得一提的是,迄今为止,美国并没有像中国的微信这样,集社交,支付,娱乐,资讯于一身的综合平台。这并不是因为美国不具备研发这种综合平台的能力,而是美国的各大金融机构与科技巨头之间存在着一种互为竞争的关系,很难实现合作关系。马斯克对于X的收购,不仅在某种程度上结束了这样的“割据”,也为其打造成一个类似微信的超级APP提供了基础。

假以时日,如果X平台真的能成为一个集音频,视频,消息,支付于一身的综合平台,Grok就会成为这个数据枢纽的中心,可以从不同行业,不同地区,不同模态里获得海量数据。如此一来,Grok的定位就不再局限于社交平台,而是成为了连接各领域的综合性交互入口。

马斯克对AI这盘棋的布局,格局很大。

组建豪华技术团队,打造能“理解宇宙真正本质”的人工智能。

人才是AI赛道的第一生产力,也是最烧钱的条件之一。而具有“钞能力”的马斯克,在打造技术团队这方面也是下足了血本。马斯克技术团队中的成员大都来自 DeepMind,OpenAI,谷歌研究院,微软研究院,特斯拉和多伦多大学,他们曾主导过多个 AI 基础算法研究和知名 AI 项目。值得一提的是,马斯克团队中的华人比例奇高,其中还有两位研究人员的论文引用数超过 20 万。

譬如例如 xAI联合创始人杨格(Greg Yang ),在哈佛取得数学学士与计算机硕士学位,师从丘成桐。丘成桐带着杨格出席活动、认识各个方向的博士生和数学家,还推荐他申请数学界本科生能取得的最高荣誉——摩根奖。

除了杨格,核心团队中还有张国栋(Guodong Zhang),戴自航(Zihang Dai),吴宇怀(Yuhuai Tony Wu)等人,他们在底层技术上有颇有建树。

由此可见,xAI 不缺人才,更不缺算力和资金。虽然如今推出的Grok-1与GPT-4之间还存在着明显的差距,不过,如果它后续拥有更大规模参数的版本出现,两者之间的差距一定会越来越小。

AI大模型的竞争是大厂与超级独角兽的竞争,这种竞争是全方位的竞争。因为AI模型预训练需要极高的成本,当未来模型版本迭代时,又需要持续投入巨大的算力和资金成本。除此之外,找到能够充分释放模型能力价值的场景也非常重要,不然无法形成反馈的循环。但也正是因为这些公司竞争的存在,与之配套的应用会越来越强,AI也将变得越来越便宜。