从2022年十一月OpenAi发布ChatGPT之后,一路上ChatGPT让人震惊不止,从ChatGPT3.5到多模态的ChatGPT-4,从谷歌的Bard到Gemini。春节期间openai推出的Sora,让人感受到了人工智能的风暴来袭。
人工智能开始真正走入平常人家之中。现在很多人的手机安装了ChatGPT的APP,可以非常方便的使用大型语言模型。随后OpenAi推出了多模态的ChatGPT-4,非常遗憾的是ChatGPT-4需要付费,因此,限制了其大范围的运用。
在ChatGPT-4的打压下,Google 终于忍不住,将Gemini 释放出来,由原来的Bard直接升级到多模态的Gemini。其功能强大到令人瞠目结舌,让Gemini处理长达一小时的视频,当你问在什么时候,出现什么情节,Gemini的回答非常准确。确实,Gemini的信息处理分析能力让人非常吃惊。
当远景顾问还正在感受Google免费多模态模型Gemini的时候,在过春节的期间,OpenAi 再次让世人感受到了巨大的震惊。OpenAi发布了可以通过文字生成视频的模型Sora。据OpenAi描述,该模型是一个现实的模拟模型,使用者只需用文字描述一个场景,Sora便可生成一个时长最高可达1分钟的视频。Sora视频对文字提示的超高还原,不仅成为科技圈的重磅热点,也迅速引爆网络,马斯克评论“人类输了”(gg humans)。只是目前sora尚未开发注册,只有拭目以待了。

看来2024年注定会成为人工智能的大爆发年,估计我们距离真正的AGI不远了,到时候人类便真正意义上拥有了能够思考与感知的除人类大脑以外的智能。突然记起,三十年前看的电影《机器人五号》的结尾,机器人五号看到飘落的树叶,它感叹道:生命是如此的美好。这个时刻注定了人类将与自己创造的智能共赴未来。