国产 AI 到底哪个最好用?
type
status
date
slug
summary
tags
category
icon
password
毋庸置疑 chatGPT 是目前最强的文本生成式 AI,但是门槛太高,注册和网络就可以拦住一大批人,并且最好用的 GPT4 还需要一个月 20 美元,成本实在太高。以至于发布了一年的 GPT4,我身边的大部分人还是没有真正用过,包括我也是开了几个月会员之后就没有再续费了。
其实我们还是经常有这方面的需求的,目前国内很多的大模型产品也发展的不错了,对于我们普通人来说,到底哪个最好用呢?我其实一直很好奇这个答案,但是大模型不像考试,有标准分数能准确界定,普通用户实际用下来感觉也差不多。所以我决定从实用的角度,找出我认为最好用的国产 AI 产品,推荐给大家。
事先说明这篇文章基于我个人的感受和主观判断,没有任何立场,我只想找一个好用的 ai 产品。然后我期望能够找到的 AI 产品:
- 使用免费
- 有很多预设智能体,不需要每次自己写提示词
- 交互体验优秀
- 可联网搜集资料
- 可以上传资料进行数据分析
- 可以识图
我主要是对产品进行体验,而非测评,确实目前 AI 的能力很难测评,每个模型擅长的角度也有所不同,所以我主要评价的方向是功能是否完备,体验是否优秀,是否有一些擅长的场景。如果想要对比一下不同 AI 对相同问题的回答效果评测,可以看这篇文章《一年过去了,国产大模型怎样了?——用户视角的 12 家 AI 产品评测》。
对比对象包括:字节豆包,智谱清言,百度文心一言,讯飞星火,阿里通义千问,Kimi 智能助手,昆仑万维天工,测评的产品都是 iOS 平台上架的 app,时间 2024 年 2 月 29 日。
下面我整理了一个表格,对表格中对比项的一些解释:
预设智能体: 可以理解为 AI 小程序,就是一个单独的 AI 能力,不仅仅是文字对话,例如上传照片生成证件照。
预设提示词:是否提供一些预设的角色,或者特定的功能提示词。
发送文件:是否能够发送 excel,pdf,word 等文件交给 AI 来分析和总结。
识图:是否能够发送图片交给 AI 来识别内容和主体。
名称
免费
预设智能体
预设提示词
联网能力
发送文件
识图
生成图片
语音发送消息
实时聊天
交互体验
特点
上面就是我整理的各个 AI 的不同功能和特点,仅用于参考,因为很多产品尽管功能有,但是生成或者识别的效果很差,有些甚至不可用,实际上没啥意义。下面从我个人角度谈谈比较喜欢的 AI。
豆包
字节的豆包是超出我预期的,一开始我完全没兴趣用它,主要是这个名字让人感觉很傻,但是真正用起来倒是让我刮目相看,毕竟是做出了抖音和飞书的宇宙厂,交互和体验是最顺畅舒服的。页面的模块也非常简洁清晰,让人一目了然,使用起来没有任何的学习成本。
豆包注重语音功能,会在发送文字的同时以语音的方式和你交流,这一点对于普通用户尤其是年龄偏大的人来说就很友好。
而且它有一个特色功能,可以通过说一段话制作自己的语音包,然后将 AI 设置为自己的声音来对话,这个功能非常惊艳,因为我感觉模拟的声音非常像(不同人的音色模拟效果会有差距)。
使用场景是什么呢?我设定了一个 AI 角色,叫溪溪的爸爸,然后设置成自己的头像,用我自己的声音,晚上和儿子聊天,给他讲睡前故事。看着他和手机上和虚拟“爸爸”聊天,我甚至有些恍惚,科技已经能够做到这种程度了吗,如果再给模型投喂我的个人经历,表达方式,聊天记录,笔记和文章,几乎就像是一个我的数字人了,而这种能力目前从技术上来说是可以实现的。
再展开想象,未来如果我离开这个世界,是不是还能以这种方式陪伴家人?假设我有这么一个数字父亲,当他离开了,在我想他的时候我想我一定会经常和他聊天。之前也有看到这类生意,将已逝之人的声音训练成一个模型,让亲人可以和他再次对话,需求非常大。只是这种能力有好有坏,也很容易被用于诈骗。
Kimi 智能助手
Kimi 客户端相比网页端少了识别图片的能力,但他属于长板非常突出的选手,可以帮我们一口气读完二十万字的小说,可以上传 100M 的文档,帮我们分析文档内容。水平相对较高,适合文字工作者,页面也很简洁。
其他
其他几家就能力中规中矩,功能都差不多,差异我在表格中都有标注,体验上来说,智谱清言是我最喜欢的,能力十分全面,页面也很简洁,算是非常全能的选手。阿里的通义千问会有一些特色的 AI 智能体,比如上传照片,让照片里的人跳舞等,还挺有趣的。
怎么选
说了那么多,应该怎么选呢?我个人的选择是日常对话用豆包,比如一些常识问题之类的,工作的时候在电脑端用 chatGPT 和 Kimi,如果需要找特定的智能体,写邮件之类,偶尔会使用智谱清言。
豆包的体验最好最易用,智谱清言最全面,Kimi 最简洁效果相对更好。其他的都大差不差,大家可以根据喜欢的厂商来选择,有时间最好都去体验一下,选择最适合自己的。
总结
在我看来,AI 发展的前期,大模型的水平高低会很明显,人工智能还是智障用户很容易分辨,但是一旦超过了某一个临界点,大家的差距就没那么大了。
谷歌内部的一个报告题目叫做《AI 没有护城河》— 译文,里面表达了这几个观点:
(1)生成式 AI 的核心技术是开源的,任何人都可以获取。某些公司可能有独家技术,但不是关键部分。AI 的架构和原理都是公开的,不同的只是各家的实现。
(2)AI 模型的替代性很强。各公司的模型有强有弱,但是核心功能都是类似的,很容易被替代。模型之间的差异,目前来看不是决定性的。
(3)AI 的核心竞争力在于算力和训练语料。谁的算力更多,训练语料更丰富,谁的模型就表现更好。
(4)AI 的研究人员是流动的。大部分 AI 研究人员来自学术界,没有竞业问题,可以自由发表成果。
最终导致的结果就是最后活下来的公司一定是资源最多的公司。我认同这个观点,AI 的发展非常需要资源,雇佣更多 AI 工程师、收集更大的语料集、支付更多训练费用,才能成为行业赢家。
但同时我认为依然存在很多机会,因为 AI 的落地最终是需要落到实际场景当中来的,模型层是巨头们的,但是应用层依然有很多需求和机会留给创业者们,举个最简单的例子,就说 AI 总结网页,目前我比较下来没有做的特别好的产品,要么不能总结全文,丢失一部分信息,要么体验割裂,不够自然。如何将模型的能力融入到人们的生活中,成为各方面的好帮手才是 AI 下一阶段发展的关键。
作为普通用户而言,就是跟上 AI 发展的步伐,积极尝试最新的产品,让最新的科技为我们所用,提升我们的能效,同时多思考 AI 的能力如何和生活结合,寻找一些有可能的商机。
写这篇文章还有一个目的是想告诉大家,现在国内已经有很多不错的产品了,不要再被应用商店里面那些收费死贵的套壳 AI 割韭菜了。过年就发现有亲戚买了套壳 AI 产品,一年两百多,完全没有必要,你也不知道他用的是哪家的大模型,可能根本就不是 chatGPT 的 API,毕竟目前国内政策不允许使用 chatGPT 的服务,一定要擦亮眼睛,最好是找能让你自己填 openai key 的产品。大家也可以将文章分享给家人,不要等到某天发现家人被割了韭菜。
- Giscus