除了模型, GPT们还在卷什么? - 少数派 -- 首页
少数派 -- 首页ChatGPT问世后,各大公司都在“大模型”上下了苦功,模型能力也成为大家最关注的话题。ChatGPT也直接定义了基于大模型的生成式对话机器人这个产品类型,其模型的强大导致大家都忽略了它在产品使用上的问题。其实不管是底层模型开发的大厂还是专注于应用层的小厂,又或者是开源的独立开发者,都在模型能力之外的产品体验上暗自较劲,试图能够参与到这场能够定义新的人机交互方式的对话革命中来。除了模型,他们还在卷什么?
1. 大厂专注模型,体验略显“简陋”,主打一个less is moreChatGPT: 三件套框架定义极简
chatgpt作为行业标杆,直接定义了生成式对话机器人行业标准。免费版本的chatgpt早期只有对话、对话管理以及简单的主题设置功能,靠着模型的能力席卷全球。随着用户的增多和抱怨,chatgpt的产品经理也做不住了,开始逐步增加一些功能。最令人深刻的当属”Upgrade to Plus”,牢牢霸占左下角的设置页,一眼望过去只有2个字,“充钱”。除此之外,也逐步增加了主题设置、隐私管理等功能,但仍然突出一个克制,颇有小龙哥真传。

付费版本的ChatGPT主要的区别在于增加了模型切换的按钮,以及在设置中增加了Beta Features的功能,可以使用联网搜索功能[Browsing]或者使用其他丰富的插件。
Bard & Bing:非差异化竞争
三巨头的剩下两家Google Bard 以及Bing Chat,也都各有各自的风格,但总体上还是维持着极简风。
Bard的功能设计逻辑与chatgpt几乎一致,对话功能为主,融合必要的对话管理、账户管理以及界面设置功能。作为搜索大拿,Bard在对话的基础上也引入了搜索的功能,能够自然地根据问题引入搜索,并呈现融合处理过的结果,体验上更加up to date。对于天气、实时信息的查询都表现良好。
大模型在生成答案时会有多个答案并且有相应的权重,Bard的“查看其他答案”功能给用户提供了更多选择,当我询问北京市天气的时候,它甚至给出了文字版本、表格版本和极简版本,非常惊艳。值得一提的是,Bard的回答生成在交互方面是一次性生成而非打字机模式(文字一个一个出现,有打字机效果,参考ChatGPT),上缺乏了生成过程,体验上感觉不够丝滑。

与ChatGPT和Google Bard不同的是,Bing Chat的定位是基于搜索的,它的工作原理是从输入中总结搜索关键词进行搜索,然后对搜索结果进行总结。每一条回复都会引用相应的来源,这同时导致它在创造力方面更缺乏,但是来源可考,保证了准确性。
Bing同样也是极简风,整体的产品界面设计与其他两家区别不大,但色彩上明显更活泼一些。功能上最开始甚至连对话管理的功能都没有,聊完了您就清空,不留下一丝痕迹。后来才增加“最近活动”的功能,用户能够看到自己最近的对话。Bing唯一的特点在于设定了三种对话样式“更有创造力、更平衡、更精确”。这与GPT模型中的高级参数[Temperature]是对应的,能够根据此参数确定模型是更精确还是更有创造性。然而在使用体验上,用户很难感受到差别,因为无法同时对比几个模式,同时即使是更有创造力的选项,受限于Bing更偏向搜索的定位,搜出的结果依旧缺乏创造力。
对比下来,三巨头比拼的主要还是模型能力,目前ChatGPT还是比较领先;Bard比较好地融合了搜索和生成两种模式,体验上是更优秀一些。Bing则缺乏使用上的亮点,但靠着一句GPT4模型就足以吸引大部分用户。
2. 中小厂深耕体验,能力之上体验狂卷不同于大厂卷模型能力,中小厂和个人开发者们更多将注意力放在了模型层上的应用层,依托各家大厂的底层模型能力,在功能和体验方面卷的飞起。
Perplexity: 让谷歌和Bing知道基于搜索的AI对话产品该怎么做
首先要说的就是Perplexity,一家对话式的搜索引擎,体验上可以说是完爆Google Bard和 Bing Chat。Perplexity。翻译为困惑度,是人工智能领域用来描述语言模型效果的一个常用指标,模型困惑度越小,说明模型越强大。Perplexity是一家只有14个员工的小型跨学科团队,但在产品力上可以说是完爆大厂,堪称more is more的典范。

在基本的ChatGPT式对话架构三件套基础上,perplexity融合了垂直领域搜索(学术\youtube\reddit\wolfram等)、搜索历史、搜索热榜、以及Copilot(类似于AutoGPT)等功能。UI设计的方式上也是采用了传统的搜索布局,对话框在屏幕偏上方,而非对话类框架输入框在下方的模式,让人一眼就知道,这个产品是更“搜索”的产品,从这点上来说,perplexity比Google和Bing更加突出了自己的搜索定位,旗帜鲜明定位清晰。
产品的逻辑与Bing类似,是对搜索结果的总结(summerize),通过多次使用感觉比Bing更加具有创造性一些,对文献的引用更加全面。在多轮对话当中,perplexity还增加了相关话题,预测了根据答案你可能会有的其他疑问,顺利的话只需要问一次,剩下的问题靠点击就可以解决了,体验上很顺畅。
对于“如何成为一名少数派作者”,笔者分别对Perplexity和Bing Chat做了测试,从回答的内容来说,Perplexity的内容更加详实,参考来源更多,同时搜索后的界面在延伸阅读、follow up提问以及排版优化上,都比Bing Chat体验要好。巨硬果然是拿脚做产品。

Poe:“美国知乎”的缝合怪
Poe是“美国知乎”Quora推出的官方AI聊天应用,接入了GPT3.5,GPT4,Claude,Midjourney等多家AI服务,是目前最官方的“AI缝合怪”。其最大的营销点,可以免费使用GPT4和Claude Instant, 然而点进去你就会发现GPT4每天只能用1次,不过每个月可以使用30次,只能说是聊胜于无吧。另外,除了缝合之外,其单个服务的产品体验非常简陋,几乎只有对话功能,长期使用体验较差。
其官方的AI对话助手Sage在使用体验上没有什么独特之处,应该也是用了gpt3.5之类的模型。

Forefront:预设Prompts/场景/人格+免费GPT4,ChatGPT最佳代替品
免费GPT4几乎是所有套壳应用的最有效宣传方式,只要你有这个功能,哪怕是每天只能用1次,你都能骗来一大波流量(鞭尸poe)。而Forefront几乎做到了GPT4的全免费。他来自一个github项目,通过逆向破解poe、bing等使用了GPT4的大厂,为普通网友提供免费的GPT4连接。在Github上狂砍37k star,几乎是最近增长最快的项目。
另外,其内置了丰富的人格预设,能够满足用户多样化的使用需求。人格化预设来自一个经典的prompts技巧,让ChatGPT扮演某一种角色,这样它的回答能够更加准确。Forefront可以一键选择超多人格,达芬奇、乔布斯、软件开发工程师等,提供了丰富的场景模板,编程帮助、创意写作、学术研究等场景都可以满足。

说完了官方主力军们,接下来介绍一下依托于官方API的各种套壳产品。他们主要是在模型的能力上对前端交互的优化以及增加了一些辅助功能,用户可以将自己的API填入并使用。这类产品更适合深度体验者以及当成生产力工具,能够定制化的细节非常多。
ChatBox:多平台客户端之王
ChatBox是目前最成熟的多平台AI聊天客户端,用户可以自主可以接入ChatGPT,Azure chatGPT服务,claude API等,在Github上获得了11.7k star,横扫客户端界。对于对客户端有执念的用户,它是windows上最好的选择。
ChatBox的架构也是基于ChatGPT的三段式架构,但每个部分都增加了更多功能,满足多样化的效率使用体验。在对话管理功能中,设置了多种预设pormpts,包括软件开发、私人助理、夸夸机等模式。
在设置中,ChatBox也支持高级参数和更详细地信息显示:首先可以自定义【temperature】参数,调整模型答案的随机性、创造性;同时可以显示API的token用量,输入输出的token估计,以及调整文字大小、默认语言等功能。用下来应该算是windows上用起来体验最好的客户端。

MacGPT:如果只能有一款GPT客户端,那就是MacGPT
至于为什么ChatBox只能是windows最好用的桌面客户端,因为mac平台上有更卷的产品:MacGPT。得益于mac系统的特点,MacGPT支持5种模式,web模式,API模式,任务栏模式,全局呼出模式以及Intext模式。任何场景都能够满足需求。
web模式相当于一个简版浏览器窗口,整个使用体验与ChatGPT一致;API模式体验与ChatBox类似,相当于一个本地的Mac客户端;任务栏模式可以支持从任务栏唤醒并且随时开启对话,依托于任务栏可以保证在任何场景下都可以快速启动ChatGPT,非常高效。全局呼出模式则支持通过热键呼出置顶的对话栏,并立刻展开对话。用过Alfred应该都能明白这种体验是多么流畅。

Intext模式更是amazing,简直是文字工作者的大杀器。当你在任何文本输入的环境(备忘录,word等)打出“/gpt”,其随后的内容就会被作为chatgpt的输入,并且直接在当前文本环境中生成回答。完全无需切换应用,就能使用ChatGPT进行问答,并且直接插入到文档中,简直就是notion的全局版本,必须吹爆。

ChatGPT-Next:每个人的云服务AI助手
如果一定要选一个web端ChatGPT的套壳客户端,那我愿称ChatGPT-Next是个人助理之王。它的作者不仅开发了这个web端的应用,而且开发了一键部署到vercel(前端托管服务器)的功能,也就是说,只需一个api key和几次单击,每个人都能拥有自己的专属chatgpt客户端,自用、团队用或者作为服务提供给其他人,都像呼吸一样简单。笔者成功将自己部署的客户端发给了爸妈和姥姥,给他们带去了一点小小的AI震撼,姥姥甚至高兴地给我做了一大碗红烧肉。

产品功能方面,ChatGPT-Next也是集大成者,预设了20种人格和应用场景,且支持自定义;高级参数方面,模型选择[model]、随机性[tempeture]、单次回复限制 [max tokens]、以及话题新鲜度[presence penalty],都可以根据需求场景精准调节。同时对话管理中的历史消息长度压缩也堪称王炸级别功能,能够在上下文数量达到一定的token时对上下文进行总结,并清除之前的记忆,能够有效减少token占用,让对话更持久。同时其界面也是所有app中可自定义程度最高的,字体、语音、发送预览、紧凑边框,全部可以自定义。
套壳类产品在功能丰富度和自定义程度方面是各个方向中最强的,长期使用下来感受最好,使用API的速度也会比各种服务的官方速度更快,是生产力玩家的首选。
4. 国内大厂生态迅速接入,创业公司更快一步钉钉、飞书、微信作为国内的三大办公IM巨头,截止目前都已经有了非官方的开源AI机器人接入。国内某创业公司通过开源社区的马拉松项目,开发了基于钉钉、飞书的AI对话机器人矩阵,融合多模态(ChatGPT、DALL·E + Whisper、midjourney)、图片创作、表格分析、文档导出、多话题讨论、公式计算等等功能全部可以实现。甚至连API也是免费提供的,真正实现了赋能业务,让国内打工人成为第一批无缝使用AI的选手。
在ToB功能方面,国内创业公司应该是走在了世界前列,已经完成了产品化的开发,并且可以根据企业情况快速部署,依托IM实现办公的AI提效。一键快速部署、企业级的AI权限管理、用户导入导出使用记录、风险词拦截等,让企业用户顺畅使用。

微信也有相应的开源机器人,但由于微信平台本身的限制,微信机器人的功能就限制较强了,基本也就是官方的功能移植到了微信对话框中。
据悉,美团内部也在进行对话机器人的接入,帮助员工提升工作效率。其小美助手内置了多个量身定制的场景和prompts,帮助员工能够快速上手。整体体验上与chatgpt几乎无异。
国内其他模型大厂的官方客户端整体都还在狂卷模型能以赶上gpt3的水平,目前也都还处在遮遮掩掩的状态,想要获得体验资格的难度比成熟产品要高的多,因此暂且不做评论,但应该可以确认,不会有更令人惊喜的功能。
5. ChatGPT在苹果App Store 登顶,移动AI时代到来5月18日,openai上线了苹果的应用商店,并迅速登顶ios下载榜第一名。移动端的chatgpt也是突出一个简洁,但整体的交互看的出来下了一些功夫。常规对话界面加入了回复的震动反馈,感觉到对面的AI真的在打字,交互体验爆棚,同时左滑交互可以呼出对话管理功能,右滑交互能够新开对话,逻辑清晰。整体使用的流畅程度也非常优秀,比web端的体验好很多。
然而,目前手机端的应用场景非常有限,周围的人也大多将其当成wiki问答来用,没有插件和联网的加持,移动端目前并没有太多应用场景,而生产力场景web端效率更高,协作也更加流程。毕竟我不能上班的时候一直扣手机吧。但ios客户端解决了一个痛点是ChatGPT充值plus难的问题,可以通过App Store直接订阅,让不少用户终于能够方便地用上GPT4。
移动端的潜力当然是巨大的,现在ChatGPT刚刚下场,但其战略上的“我全都要”是可以窥探到的。在前有Poe、Snapchat移动端的情况下,ChatGPT的下场无疑让移动端的竞争格局一下子不同了起来,未来会发展成什么样子我们拭目以待。
小结ChatGPT带来的AI变革将深刻改变社会的发展方向,现在是混沌的乱斗局面,大家都卯着劲想做出点什么。模型不是普通人能做的,所以出现了更多以场景应用为主的产品,也给创业者和开发者们提供了许多AI应用的思路。本土化是另一个重要的课题,国内大厂在进度上明显落后,但应用层已经先行并且有了很多好用的产品,这将来也会是竞争最激烈同时机会最多的地方。乘上这波AI的大浪吧,不妨做一头飞起来的猪。
欢迎关注PandorAI,我们致力于帮助AI创业者获得更多洞察。
小红书:PandorAI
Notion:PandorAI
Twitter:PandorAI
主页:PandorAI
本文章由 flowerss 抓取自RSS,版权归源站点所有。