杏鑫招商登陆_一文读懂AI搜索模型

   |    2024年5月22日  |   杏鑫注册  |    0 条评论  |    39

 

这两年,不少大模型公司布局AI搜索,很多人也感受到技术带来的快捷,不过,使用过程中,根本没意识到信息是否准确。

所以,怕你被AI误导。

我抽出时间,做了一个简单科普,比如:AI搜索的决策模型什么样?为啥机器味严重?AI搜索和内容平台的关系是什么?未来搜索会发生什么革命性变化等等。

毕竟了解底层知识,能够帮你,更好的用AI搜索。

01

有个词叫缸中之脑(Brain in a Vat)。什么意思呢?

想象一个血腥的画面:

你(或者别人)被一位疯狂的科学家,进行一次可怕的实验。他把大脑从身体上取下来,放进一个装有维持大脑存活的营养液的玻璃钢中。

然后,大脑神经末梢,链接到一台超级计算机,计算机按照设定程序,向你的大脑发送各种信息,让你以为以前很正常。

那么,对取出来的大脑来说,世界是不是依然和原来的一样?你看到的人、物体、天空,感受,还有记忆,是不是都还在?

这个实验,常用来说明怀疑论、唯我论和主观唯心主义的观点,简单讲:即我所体验的、看到的、到底是真的假的呢?

怕你共情不多,我再举个例子:

好不容易休息半天,躺在沙发上,看着外面阴雨天,突然想到昨天刚上映的恐怖片,还没看。于是,打开影片,刚看一半,心跳加速,你决定不看了。

为什么?因为太恐怖了。恐怖画面的信息,一次次传递到“缸中之脑”,让你觉得太真实,似乎恐怖画面马上要出现在自己身上。

但你知道吗?这些都是大脑模仿出来的,看似真实,未必真实,我们的感知,不仅由大脑产生,身体,也会影响它。

比如:

521到了,即便没有见面,你总送心爱的人一些温暖的东西,一杯奶茶、一束鲜花,她收到礼物那一刻,在远方也能感受到你对她的好看。

这就是具身认知,是思考,感觉、行为三者共振的结果,认识到它,你能感受到,外面我们接收到的任何信息,故事是一个个画面,所描绘的场景只要大脑熟悉,它都会共鸣。

而AI搜索,是什么呢?本质像一个“缸中之脑”。

运行在一个强大的模型上,模型像它的基础,帮它站稳脚跟,外面信息是它的食物,通过你的搜索,不断训练自己推理能力。

不论什么AI搜索软件,当你问题时,它都会遵循一个六步走的公式:

  • 理解问题
  • 检索信息
  • 整合答案
  • 生成回答
  • 结果验证

幻想一下,现在来到未来时代,站在图书馆里,面前有一个人工智能,现在要找一本《穷查理宝典》,你会怎么做?

你可以手动输入,或者对着它说:“帮我找一本叫《穷查理宝典》。”此时,AI会利用语言技术,快速分析你的意图,提炼出最重要的部分,比如:书名、作者、人名。

然后,它会把你的问题和图书馆里的文档、图片快速匹配,从中找出重要的段落和句子。接着,它会做降噪处理,去掉干扰的内容,比如广告、重复的段落,确保剩下的都是有用的信息。

最后,AI会把所有找到的信息整合起来,生成一个答案,这就是AI搜索的过程。不难理解吧。

我突然想到一个画面:

小时候,老师经常说:“哎,你们是我带过最差的一届,要是无法理解,就把这段内容死机硬背下来。”,可你有没有想过,考试对死记硬背来说,意图是什么?

从人工智能角度看,答案只有一个词:检索。

也就是说:你背诵的所有资料,最后一刻,学校用一张试卷来检索大脑有没有记住,当成绩达标时,证明你通过了。

02‍

明白AI搜索的六步公式,能得到什么启发呢?有两点:

一,知道AI的回答为什么很干巴,二,知道它为何缺乏情感和个性。

AI搜索生成逻辑有一些限制,为避免产生错误信息和不准确的信息,AI会倾向于保守地给你高频、标准化的表达。这种倾向自然会使回答显得更加刻板。

比如:

你问AI如何做好品牌营销?它一定会告诉你,首先要了解目标市场,然后创建一个独特的品牌定位,接着进行市场推广,最后通过反馈不断优化品牌策略。

另外,作为“缸中之脑”,AI只有一个搜索框,无法感受你的语气,看不到其他信息,所以也无法理解你的情感。

这样一来,AI生成的答案就缺乏人类的情感色彩和个性,看起来很机械,或者像是官方的回答。

值得一提的是:人们常说,一个人学习什么知识,他的见识就有多高。AI也是一样的。你给它喂草料,它自然吐不出钻石来。

所以,大公司为了防止AI搜索出来的内容很水,就会限制训练内容,会给AI喂新闻报道、学术论文和正式文本。这些文本风格比较客观,所以,AI学完后,回答也会是类似的风格。

现在AI搜索虽然看似有推理能力,但我测试了很多,发现整体推理还是比较弱。

一个主要原因,人类说话时,本身推理性就不强。所以,AI学习的内容也会相对较弱。在文字相关的搜索上,这种情况很常见,理科的内容相对更严谨一些。

显然,“缸中之脑”就是“缸中之脑”。看似聪明,但离不开三点:一,大模型作为基础,二,固定的模型,三,知识库。

因此,重要的结论是:用AI搜索时,你不给它一个很健全的 prompt,它的解析能力会变得很弱,得到的答案自然很难让人满意。

03‍

你有没有想过,AI搜索平台和内容生态到底什么关系?

我觉得,从过去的传统搜索,到现在AI搜索,用一句话来形容转变的过程便是:从独立到融合,再到独立。

为什么呢?

没有大模型之前,谷歌在1998年开始做大规模搜索,后来进军中国,由于数据方面的问题,谷歌被限制,随后,百度在2000年快速崛起,靠爬虫抓取大量网页,然后分发和售卖广告起家。

这两家公司商业模式基本相似。

谷歌做了一个叫Knowledge Graph的知识库,还有Google Answers,百度则推出了“百度知道”和“百度百科”。

后来,国内360、搜狗也跟着做类似的产品。网页时代落幕,张一鸣用一个算法推荐,让今日头条拔地而起。头条采用推荐机制的同时,也尝试建立内容生态。

比如:

孵化垂类创作者,推出各种与内容相关的产品,但直到现在,我都觉得它还没成功,今日头条增长停滞后,头条搜索也没法跟着增长。

后来短视频涌现,抖音起来,它建立一个良好的内容生态和增长模式,所以,抖音搜索成功了。

不管怎么样,它们的核心目的只有一个,把内容控制在自己手里,通过掌握内容,建立壁垒,因为内容生态对搜索平台有很大的依赖性。

内容提供者,要依靠搜索引擎,来让内容被更多人看到,而搜索引擎,则要高质量的内容来吸引用户,并提供有用的搜索结果。

有了大模型之后呢?

微软推出新版必应,紧接着谷歌、百度、360和昆仑万维等企业也开始布局AI搜索。

李彦宏一直强调,把生成式AI技术和搜索深度整合在一起。周鸿祎也说,做搜索引擎的企业,最有机会研究像ChatGPT这样的产品,还有昆仑万维、秘塔AI也在加紧跟上。

不管怎么说,它们有相似之处:整合全网信息,让用户用自然语言表达需求,并提供经过组织和提炼的答案,这样可以减少冗余信息的时间消耗,确保答案的可追溯性、可信赖性。

不过,尽管这些搜索引擎,凭借原有的知名度、用户基础在市场上占据主导地位,由于移动互联网时代APP的“信息孤岛”现象,它们并没有完全掌控所有信息,反而,垂直搜索引擎正在逐渐崛起。

比如:

小红书推出自己的搜索,今日头条推出豆包,淘宝推出原生AI应用——淘宝问问,它嵌入淘宝搜索框,服务于月活跃用户近9亿、每日产生数百亿次搜索的庞大流量。

现在,抖音搜索量在移动端已经超过百度,小红书通过用户的真实分享和有用的笔记,建立了强大的社区氛围,这都是各自的优势。

因此,我看到两种趋势正在出现:一是通用搜索的AI升级,二是垂类搜索的崛起。

垂类搜索数据,主要来自自己的平台,类似于站内搜索,信息更服务于细分场景。当信息量足够多时,就会自然涌现。

长远来看,拥有优质内容的社区,做的搜索会更有优势,因为好内容平台能够吸引和留住用户,进而提升搜索功能的价值和使用频率。

明白这些也就理解了,我为什么说,搜索会经历从独立到融合,再到独立的过程。毕竟,独立,是全新的独立,是细分的独立。

实在不信的话了,你想想360AI、秘塔AI,天工AI到底有什么区别?把它们和淘宝问问、抖音搜索一比更明确呢?因此,未来优质内容社区的搜索功能将会胜出。

04‍

到这里,我们可以思考下:AI搜索的本质是什么?

我认为,AI搜索真正的关键在于AI技术本身,而不是传统的搜索方式。这就像“AI+”和“+AI”的区别。

AI+,更像把AI技术加到已有的系统或产品上。比如,在传统搜索引擎上加入AI功能,这种方式主要在现有技术基础上,增强功能。

+AI,不一样。

要求从一开始就以AI为核心,建立一个系统或产品。比如,设计一个完全依赖AI进行的搜索引擎,它所有功能都围绕AI技术展开,更像是从头开始,完全依赖AI技术运作。

很显然,“AI+”是改进现有系统,而“+AI”是从零开始,完全依靠AI技术。AI搜索真正力量在于后者,也就是“+AI”。

对于一般简单问答,AI搜索只弥补传统搜索的不足。但要真正创新和突破,要寻找新的应用场景和特定领域,比如学术、医疗、法律等。这些领域中,AI驱动的搜索才能真正发挥战略意义。

“AI原生”(AI Native)很重要,因为经过多年的发展,传统方法已经挖掘了所有可能性,AI原生的定义是,只有在引入AI能力的情况下,产品才能实现。

这种情况下,AI是最大的变量,但AI比例并不重要。

关键在于产品需要找到交叉点:哪些场景是只有AI才能实现?同时又满足大规模用户需求。这种探索越多越快,竞争优势就越大。这也是对各家产品经理的巨大考验。

那么,问题来了:

有人会觉得,传统搜索市场还有价值吗?肯定的。

传统搜索的强项在于寻址和寻找资讯。从商业角度看,PC端搜索市场增量有限,移动端又被抖音、小红书等平台分流,不过,百度财报中,搜索引擎依然是基本盘的重要组成部分。

还有人认为,谷歌和百度垄断这么多年,其他玩家还有机会吗?来看一组美国statcounter机构的数据:

截至2024年5月6日,美国搜索市场中,谷歌份额下降到了77.52%,其他市场被Bing和Yahoo蚕食,但谷歌基本盘还算稳。国内截至4月,电脑端必应的份额是37.24%,百度是22.53%,但百度的主导地位已经不在了 。

虽然数据会存在 偏差,但能看出搜索市场的变化和机会,AI搜索更应该理解用户意图,完成复杂的任务。

比如:

用户搜索不仅仅是寻找信息,还包括找地址,或查找短内容的源头;再比如,通过AI找到过去5年城市人口的发展趋势,甚至,搜索新能源汽车的渗透率趋势和原因。

还有找电影、追溯图片等等……,所以,需求背后,是AI搜索目前还没有攻克的场景。

总结而言

AI+,还是+AI,要看企业选择。

不论哪条路,我都认为,垂直领域的数据,将成为重要开采对象,不然怎么向数据要增量?那么问题来了:什么样的垂直数据还未被开采呢?嗯,值得思考的问题。

 

作者:王智远

来源公众号:王智远(ID:Z201440)

扫一扫 微信咨询

《免责声明》如对文章、图片、字体等版权有疑问,请联系我们 。 广告投放 找客户 找服务 蘑菇跨境

噢!评论已关闭。