自从大语言模型 ChatGPT 在 2022 年横空出世之后引发了 AI 产品的热潮,无论是软件还是硬件,都呈现出日新月异之势。也发现自己在近半年,可能是因为少刷 Twitter 了,而对新事物的嗅觉敏锐弱化了很多。

最近因为获得了一段时间比较规律的实习机会,也有空专门抽出时间来体验一下。

小爱音箱

小爱音箱是小米在 2019 年发布的一款智能音箱,其搭载的小爱同学可以连接网络,操控小爱同学播放音乐,控制联网家居。这在现在看来已经见怪不怪了。

但是呢,小爱同学今年 9 月的时候加入了大语言模型,虽然用起来还是很呆,但是丰富的知识库现在甚至可以让其教我区分 C++ 中的智能指针和传统指针的差别。

虽然如果有更好的提示词工程(Prompt Engineering),我相信小爱同学可以更近一步的提升我们的体验:

例如我说:“今天我觉得好热啊”的时候,小爱同学可以帮我开空调(从 Language 到 Action),就好了。

但是我仍是非常喜欢这款升级后的 AI 产品,中学时的玩伴,现在甚至比我还聪明了。

Claude 3.5 Sonnet

最开始用的时候是因为要获取 Screenshot to Code 的 API 而注册了 Claude 3.5 Sonnet,但没想到没有 API 免费试用。注册风控很严格,我也终于忍不住花 12 块钱买了 sms-activate 的虚拟号码服务来注册。

于是还是选择体验一下它和 ChatGPT 写代码有什么不同了,并没有深入体验,只是选择让其为我写一份个人主页的代码:

Claude

预览体验和网页的效果做的十分出色。

Screenshot to Code

在推特上看到国人做的镜像项目,顺藤摸瓜去看了原作者。产品如其名,就是讲半年前演示的 GPT4-o 根据截图写代码的功能通过开源的方式实现了出来,整体配置上还是很容易的,效果没有宣传片做的那么好,但是也确实很惊艳: image-20241031215103015

AI 生产的图片虽然是出于演示用途,但是未免也太吓人了。

Arc 浏览器

因为 Chorme 的协议禁止加载 Screenshottocode 的插件于是找了这款浏览器作为替代。从买 Mac 之前就听说过这款产品,觉得之前的浏览器够好用了就没有切换的动力。听到的消息从要出 Windows 版,变成腾讯推出竞品,再到 CEO 宣布 Arc 不会推出 2.0,每一个新闻都有不少的话题性,给人一种这款浏览器很火的感觉——可以看出来人们对一款新的浏览器还是充满了很多期待的。可是最后一则新闻也预示了不好的事情,于是我也便读到了下面一则讨论和一则新闻:

使用上来说多了很多美学的交互和反传统的操作(例如 Command/Ctrl + T 居然不是打开新标签页而是直接搜索,这很直接,但是我觉得很多人打开新标签页的时候脑子都是空白的也不一定是要搜索什么东西),我觉得用起来没有传统的浏览器趁手。

image-20241031221304071

其中加入的 Max AI 功能倒是有不错的启发:随时通过 AI 理解网页内容。UI/UX 做的比 Edge 的传统 Copilot 好很多。

Cursor

这款声称要取代 VSCode 的 AI 编辑器受到的赞誉就很多了,上周写程序匆匆忙忙用了一下,感觉就像 GitHub Copilot + VSCode(连 UI 也很像),没用出什么门道。打算看看 YouTube 视频再试试。不得不说还是有上手门槛的。

image-20241031221209191

总结

我最开始想写这篇博客是因为我在用小爱音箱之后深有感触写下的一段笔记

一开始觉得大模型应该是性能越强越重要

现在有些改观了,越便利才越重要

比方说最近因为没有外网而在用的 Kimi,以及今天升级大模型的小爱音箱

他们带给我的幸福感是之前的大模型没有带过我的

大模型之间的差距只会越来越小,体验至上,应用至上

我觉得大模型的推理能力差距只会越来越小,AI 可以作为辅助但不应该成为目的。特别是最近看了几个手机厂商的发布会切片之后更加觉得,我们是否为了宣传「大模型」而只剩下「大模型」了呢。