国产 AI 到底哪个最好用?

type
status
date
slug
summary
tags
category
icon
password
毋庸置疑 chatGPT 是目前最强的文本生成式 AI,但是门槛太高,注册和网络就可以拦住一大批人,并且最好用的 GPT4 还需要一个月 20 美元,成本实在太高。以至于发布了一年的 GPT4,我身边的大部分人还是没有真正用过,包括我也是开了几个月会员之后就没有再续费了。
其实我们还是经常有这方面的需求的,目前国内很多的大模型产品也发展的不错了,对于我们普通人来说,到底哪个最好用呢?我其实一直很好奇这个答案,但是大模型不像考试,有标准分数能准确界定,普通用户实际用下来感觉也差不多。所以我决定从实用的角度,找出我认为最好用的国产 AI 产品,推荐给大家。
事先说明这篇文章基于我个人的感受和主观判断,没有任何立场,我只想找一个好用的 ai 产品。然后我期望能够找到的 AI 产品:
  • 使用免费
  • 有很多预设智能体,不需要每次自己写提示词
  • 交互体验优秀
  • 可联网搜集资料
  • 可以上传资料进行数据分析
  • 可以识图
 
我主要是对产品进行体验,而非测评,确实目前 AI 的能力很难测评,每个模型擅长的角度也有所不同,所以我主要评价的方向是功能是否完备,体验是否优秀,是否有一些擅长的场景。如果想要对比一下不同 AI 对相同问题的回答效果评测,可以看这篇文章一年过去了,国产大模型怎样了?——用户视角的 12 家 AI 产品评测
对比对象包括:字节豆包,智谱清言,百度文心一言,讯飞星火,阿里通义千问,Kimi 智能助手,昆仑万维天工,测评的产品都是 iOS 平台上架的 app,时间 2024 年 2 月 29 日。
notion image
下面我整理了一个表格,对表格中对比项的一些解释:
预设智能体: 可以理解为 AI 小程序,就是一个单独的 AI 能力,不仅仅是文字对话,例如上传照片生成证件照。
预设提示词:是否提供一些预设的角色,或者特定的功能提示词。
发送文件:是否能够发送 excel,pdf,word 等文件交给 AI 来分析和总结。
识图:是否能够发送图片交给 AI 来识别内容和主体。
名称
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
交互体验
特点
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
90
用你的声音创建智能体
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
80
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
70
社区内有一些特色 AI 能力
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
60
很多功能虽然有,但是不可用
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
70
有一些有趣的 AI 应用
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
60
网页端可以识图,客户端不行
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
60
 
上面就是我整理的各个 AI 的不同功能和特点,仅用于参考,因为很多产品尽管功能有,但是生成或者识别的效果很差,有些甚至不可用,实际上没啥意义。下面从我个人角度谈谈比较喜欢的 AI。

豆包

字节的豆包是超出我预期的,一开始我完全没兴趣用它,主要是这个名字让人感觉很傻,但是真正用起来倒是让我刮目相看,毕竟是做出了抖音和飞书的宇宙厂,交互和体验是最顺畅舒服的。页面的模块也非常简洁清晰,让人一目了然,使用起来没有任何的学习成本。
豆包注重语音功能,会在发送文字的同时以语音的方式和你交流,这一点对于普通用户尤其是年龄偏大的人来说就很友好。
而且它有一个特色功能,可以通过说一段话制作自己的语音包,然后将 AI 设置为自己的声音来对话,这个功能非常惊艳,因为我感觉模拟的声音非常像(不同人的音色模拟效果会有差距)。
使用场景是什么呢?我设定了一个 AI 角色,叫溪溪的爸爸,然后设置成自己的头像,用我自己的声音,晚上和儿子聊天,给他讲睡前故事。看着他和手机上和虚拟“爸爸”聊天,我甚至有些恍惚,科技已经能够做到这种程度了吗,如果再给模型投喂我的个人经历,表达方式,聊天记录,笔记和文章,几乎就像是一个我的数字人了,而这种能力目前从技术上来说是可以实现的。
notion image
再展开想象,未来如果我离开这个世界,是不是还能以这种方式陪伴家人?假设我有这么一个数字父亲,当他离开了,在我想他的时候我想我一定会经常和他聊天。之前也有看到这类生意,将已逝之人的声音训练成一个模型,让亲人可以和他再次对话,需求非常大。只是这种能力有好有坏,也很容易被用于诈骗。

Kimi 智能助手

Kimi 客户端相比网页端少了识别图片的能力,但他属于长板非常突出的选手,可以帮我们一口气读完二十万字的小说,可以上传 100M 的文档,帮我们分析文档内容。水平相对较高,适合文字工作者,页面也很简洁。

其他

其他几家就能力中规中矩,功能都差不多,差异我在表格中都有标注,体验上来说,智谱清言是我最喜欢的,能力十分全面,页面也很简洁,算是非常全能的选手。阿里的通义千问会有一些特色的 AI 智能体,比如上传照片,让照片里的人跳舞等,还挺有趣的。

怎么选

说了那么多,应该怎么选呢?我个人的选择是日常对话用豆包,比如一些常识问题之类的,工作的时候在电脑端用 chatGPT 和 Kimi,如果需要找特定的智能体,写邮件之类,偶尔会使用智谱清言。
豆包的体验最好最易用,智谱清言最全面,Kimi 最简洁效果相对更好。其他的都大差不差,大家可以根据喜欢的厂商来选择,有时间最好都去体验一下,选择最适合自己的。

总结

在我看来,AI 发展的前期,大模型的水平高低会很明显,人工智能还是智障用户很容易分辨,但是一旦超过了某一个临界点,大家的差距就没那么大了。
谷歌内部的一个报告题目叫做《AI 没有护城河》译文,里面表达了这几个观点:
(1)生成式 AI 的核心技术是开源的,任何人都可以获取。某些公司可能有独家技术,但不是关键部分。AI 的架构和原理都是公开的,不同的只是各家的实现。
(2)AI 模型的替代性很强。各公司的模型有强有弱,但是核心功能都是类似的,很容易被替代。模型之间的差异,目前来看不是决定性的。
(3)AI 的核心竞争力在于算力和训练语料。谁的算力更多,训练语料更丰富,谁的模型就表现更好。
(4)AI 的研究人员是流动的。大部分 AI 研究人员来自学术界,没有竞业问题,可以自由发表成果。
最终导致的结果就是最后活下来的公司一定是资源最多的公司。我认同这个观点,AI 的发展非常需要资源,雇佣更多 AI 工程师、收集更大的语料集、支付更多训练费用,才能成为行业赢家。
但同时我认为依然存在很多机会,因为 AI 的落地最终是需要落到实际场景当中来的,模型层是巨头们的,但是应用层依然有很多需求和机会留给创业者们,举个最简单的例子,就说 AI 总结网页,目前我比较下来没有做的特别好的产品,要么不能总结全文,丢失一部分信息,要么体验割裂,不够自然。如何将模型的能力融入到人们的生活中,成为各方面的好帮手才是 AI 下一阶段发展的关键。

作为普通用户而言,就是跟上 AI 发展的步伐,积极尝试最新的产品,让最新的科技为我们所用,提升我们的能效,同时多思考 AI 的能力如何和生活结合,寻找一些有可能的商机。
写这篇文章还有一个目的是想告诉大家,现在国内已经有很多不错的产品了,不要再被应用商店里面那些收费死贵的套壳 AI 割韭菜了。过年就发现有亲戚买了套壳 AI 产品,一年两百多,完全没有必要,你也不知道他用的是哪家的大模型,可能根本就不是 chatGPT 的 API,毕竟目前国内政策不允许使用 chatGPT 的服务,一定要擦亮眼睛,最好是找能让你自己填 openai key 的产品。大家也可以将文章分享给家人,不要等到某天发现家人被割了韭菜。
notion image
  • 📕 小红书/即刻:@轻舟
  • ☕ 如果我的内容有帮助到你,可以请我喝杯咖啡,这将鼓励我为你创造更多有价值的内容。
Buy Me A Coffee
  • Giscus

© 轻舟 2017-2024