OpenAI的12份圣诞礼物,透露出AI公司领头羊的困境

AI界最会营销的公司OpenAI,总算放完了所有的圣诞礼物。

从12月4日开始,OpenAI进行了为期12天的发布活动,每个工作日都有新的产品发布或功能演示。

一开始听到这个消息,大家都很兴奋,猜测AGI难道真的要来了?

虽然OpenAI的发布时间正好是北京时间的凌晨2点,但还是有不少AI媒体和玩家熬夜蹲守直播。

我们浅跟了两天,立马就发现被耍了,合理怀疑是Sam Altman变相“清库存”的手段。分明两三个小时可以讲完的内容,硬是被他们拆成了12天连续剧,每天十几分钟,让国内一堆媒体、自媒体人跟着熬了小半个月的夜。

社交平台上对此次直播的看法也褒贬不一:

图片

说什么信什么的兴奋派

图片

看好OpenAI的期待派

图片

苦苦抱怨的等待派

图片

会说真话的预言派(这12天中发布的新功能,确实没有开放)

图片

图片

奔向竞对的粉转路派

在大家对OpenAI“饱含期待又遗憾离去”的12天里,谷歌却密集地发布了很多AI产品,没有任何预告,出手就是“王炸”:

图片

最近没有看直播的朋友不用遗憾,我们梳理了这12天的发布精华,借着复盘这次旷日持久的“新品发布会”,看看OpenAI这家曾经被捧上神坛的行业领头羊是如何失去昔日光芒的?

12天直播内容全盘点,

多少人乘兴而来败兴而归?

第一

12月6日,OpenAI发布了o1模型正式版,其推理能力比之前有很大提升,响应速度也提高了50%以上。

这里最大的亮点是,OpenAI的研究员展示了o1如何在53秒内回答了相当专业的化学知识,并给出所有标准答案。

图片

如果说OpenAI对于o1的迭代在意料之中,那么他同时推出每月200美元的ChatGPT Pro订阅服务,真的让我们大为震撼。

200美元,1460元人民币,什么概念?可以说,这些钱能为AI视频、AI音乐、AI聊天机器人等工作流程中涉及的所有国内AI工具买单。

这么想来,是不是太贵了?OpenAI你变了,说好的AI普惠呢?

图片

图片

图片

图片

要说毒舌还得是网友

第二天

第二天的直播,Sam Altman干脆不来直播间了。

这一轮发布的技术面向的是企业用户。企业用户可以利用“强化微调”(Reinforcement Fine-Tuning)技术,来定制自己的o1mini模型。

给大家解释一下“强化微调”技术,就是利用强化学习原理,进一步提升模型在特定领域的推理能力,使其在特定任务上表现更好。

这种技术可以提高模型的准确性,还能增强对类似问题的推理能力。

图片

对于专门研究大模型的专家来说,这一技术很重要。但这个能力实际上要到明年才会真正公开推出。OpenAI还提到,如果个人用户有需求,可以尝试申请:

https://openai.com/form/rft-research-program/

第三天

Sam终于带着Sora走来了!12月10日凌晨,我们期待已久的视频生成模型Sora正式发布。

据OpenAI介绍,Sora支持用户生成最高1080p、最长20秒、多种尺寸比例的视频。用户可以使用文本、图像和视频三种方式提示Sora生成视频,并利用混合、重剪、融合和风格预设等功能对视频进行编辑修改。

但发布第一天,大多数用户就面临Sora网页崩溃,停止新用户注册的问题。

图片

图片

图片

等了一年的期货,效果怎么说呢,相比国产AI视频模型已经没有太多优势了。“AI新榜”也在第一时间连线了首位华人艺术家Junie,邀请她分享用Sora成片的经验。

第四天

这一天,Sam Altman没有出现。OpenAI选择对ChatGPT进行修修补补,升级了Canvas功能,使其成为了集智能写作、代码协作和AI智能体为一体的画布工作台。

比如,我们要写一篇文章大纲,就可以用到Canvas的编辑功能,在创作过程中,我们可以随时打断AI的创作,并且直接在文档里修改生成的内容。AI会实时调整后续内容,保证其中的连贯性。Canvas让这一环节变得更像“共创”。

另外,团队还展示了代码调试的过程,能够实时编辑和修改错误代码,提出具体的代码修改建议,让用户一键应用。

图片

可惜的是,Canvas目前不支持GPT o1模型,而同为开发者工具的明星产品Cursor不仅支持o1,还有更细致的功能集。

图片

当然,这个曾经只向付费用户开放的功能,现在会面向所有ChatGPT用户开放使用,让更多人可以体验到AI辅助创作的优势。这算是OpenAI AI普惠计划的一小步?

第五天

Sam Altman出现了!这一天对OpenAI来说应该是个大发布。OpenAI宣布ChatGPT和苹果智能深度整合。

主要涉及三个方面:

首先是和Siri协作,Siri可以唤起ChatGPT,并将相关任务转移给ChatGPT处理。其次,用户长按iPhone16的相机控制按钮,可以让ChatGPT实时分析画面中的内容。另外,用户还可以使用ChatGPT撰写和细化文档内容。

图片

图片

据彭博社此前统计,ChatGPT为苹果、谷歌、微软等科技巨头带来了8万亿美元的红利。有报道称,OpenAI实现10亿用户目标的关键就是“和苹果合作”。

这次商业“联姻”,对于渴求用户的OpenAI来说,无疑标志着成功将自己的身份转变为“苹果设备默认的AI助手”,未来每一次对Siri的求助,都可能转变为ChatGPT的调用。

不过,这一次商业合作宣布后,ChatGPT还出现了长达4小时的故障。

图片

图片

网友的吐槽

值得一提的是,谷歌在同一天发布了Gemini2Flash这一全新模型,不仅实现了速度上的提升,还支持音频和图像的多模态输出能力。

一边是官宣商业化“联姻”,但对技术避重就轻,一边是AI领域的突破炸场,谁都能分辨孰强孰弱吧?

第六天

OpenAI在发布会的第六天,推出了高级语音模式视觉功能。

简单来说,就是ChatGPT能看到屏幕上的内容以及用户本人,通过视觉和听觉与用户互动,并进行反馈。

这一高级语音视觉功能,其实已经在5月份的时候展示过了。当时和GPT-4o模型一起发布,彼时,大家认为这是OpenAI版《Her》,对它充满了期待。

在直播演示环节,OpenAI研究人员根据ChatGPT和语音视觉功能的指示,制作了一杯咖啡。

图片

再仔细想一想这个功能熟悉吗?其实就是智谱清言玩剩还开源的视频通话

本文来自投稿,不代表金塔网立场,如若转载,请注明出处:https://www.jtagf.com/show_1900.html

打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
joyckiss joyckiss
上一篇 2024年12月24日 16:30
下一篇 2024年12月24日 17:50

相关推荐