对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键
Sean Mullaney是Algolia(端到端人工智能搜索和发现平台)的首席技术官,也是前 Stripe和谷歌高管,拥有扩展工程组织、开发人工智能驱动的搜索和发现工具以及在全球范围内发展API优先解决方案的背景。
在Algolia,他负责监督仅次于谷歌的第二大搜索引擎背后的技术,该引擎每年的搜索量超过1.5万亿次。最近,他领导公司推出了AlgoliaNuralSearc一一世界上最快的、超可扩展且经济高效的矢量和关键字搜索API。
Budding Interests
采访者:计算机科学最初吸引你的地方是什么?
Sean Mullaney:我10岁的时候,父母给家里买了第一台电脑。我想做的第一件事就是弄清楚如何编写一款我从书上抄下来的文字冒险游戏。几年后,我开始学习 c++,但作为一个刚刚开始探索计算机科学的青少年,对于设计和制作电脑游戏的兴趣还是比较大。
采访者:你在谷歌工作了7年多,在那里你帮助建立并领导了战略、运营、大数据和机器学习方面的团队。你最喜欢的项目是什么?你从这个经历中学到了什么?
Sean Mullaney:我们弄清楚了如何利用我们拥有的关于广告商如何使用我们的产品来帮助销售团队的大数据。我们编写开发的自定义规则(后来更复杂的神经网络)来预测应该在什么时闻用什么产品接触哪些客户,从而最大限度地提高销售人员的时间并带来可观的收入。谷歌上有超过100万的广告商,这个工具极大地帮助销售团队在大海捞针。
采访者:在最近的DevBit总结中,你描述了Algolia的目的是让用户能够索引世界并将内容运转起来,能详细解释一下这句话是什么意思吗?
Sean Mullaney:最终,我们希望帮助我们的客户从他们的数据中获得价值。互联网创造了大量的内容和电子商务产品,虽然这一发展是一个重要的里程碑,但现在大量的信息意味着,作为用户,找到你真正想要的东西比以往任何时候都要困难。然而,当搜索和发现由人工智能驱动时,可以智能地访问不断增长的内容列表,并将其付诸行动,真正帮助用户,而不仅仅是压倒他们。
Technical Introduction
采访者:2022年9月,Search.io及其专有旗舰产品NeuralSearch™被Algolia收购,您能讨论一下这项搜索技术具体是什么吗?
Sean Mullaney:简而言之,Algolia NeuralSearch将关键字匹配与基于向量的自然语言处理集成在一个API中,这是业界首创。该解决方案结合了我们专有的首创神经散列技术,使矢量的使用可扩展,并且使用成本效益提高90%——这是其他人工智能公司(包括 ChatGPT)面临的问题。这款突破性产品真正令人兴奋的是,它使真正的人工智能搜索可扩展到企业级组织。
新技术还允许零售商等客户理解并提供与查询相匹配的内容,这些查询通常过于会话化,无法提供准确或任何结果(被认为是长尾)。这些内容占当前网站搜索量的55%。作为唯一一个将人工智能应用于查询理解、检索和排名的端到端人工智能搜索解决方案,,NeuralSearch真正理解这些查询,并将错失的机会转化为收入。
采访者:除了Neuralsearch™之外,还使用了哪些其他机器学习方法?
我们将人工智能整合到三个主要功能中一一查询理解、查询检索和结果排序。我们在Algolia称之为人工智能搜索三明治:
查询理解:Alqolia的高级自然语言理解(NLU)和AI驱动的矢量搜索提供自由形式的自然语言表达理解和AI驱动的查询分类,可准备和构建用于分析的查询。此外,基于用户反馈的自适应学习可以对意图理解进行微调。
检索:然后检索最相关的结果,并从最相关到最不相关进行排序。检索过程使用相同的索引将神经散列结果与关键字进行合并,以方便检索和排序。这种方法解决了“空结果”问题,并显著提高了点击位置和点击率。在搜索和发现领域中没有其他搜索平台能够提供这种强大的功能。
排名:最后,Algolia的人工智能重新排名将最好的结果推到顶部,该排名考虑了搜索查询附带的许多信号(包括精确的关键字匹配分数、上下文个性化配置文件、观察到的受欢迎程度、项目的数量、语义匹配分数等)并学习达到最大的相关性。
此外,随着索引的变化、新产品的添加、新内容的上传,或者术语的新含义,人工智能驱动的AlgoliaNeuralSearch产品将自动学习和调整。它不需要任何额外的人员统计或人工操作,它会根据查询或搜索短语自动匹配关键字或概念(可能是两者的混合)。这使搜索处于自动驾驶状态。
keys To Success
采访者:Algolia最近将其免费计划从提供1万条记录增加到100条记录,这背后的想法是什么,市场反应如何?
Sean Mullaney:我们选择通过引入两个新的面向开发人员的计划来改进Algolia的定价和包装,使其更加适合开发人员:一个是免费的“构建”计划,一个是以实惠的价格提供轻松可扩展性的“增长”计划。
新的Build计划将开发人员可以在Algoli中存储的免费记录数量从1玩条增加到现在的 100万条记录。这意味着开发人员现在可以在Algolia中建立索引的免费记录数量增加了 100倍。此外,Algolia将其Grow计划中的搜索请求成本削减了50%,将记录成本削减了60%。
我们更新的“构建”定价计划背后的想法是让开发者免费访问其人工智能搜索和发现平台的全部功能。当开发人员准备扩展其应用程序时,“增长”计划使开发人员能够为实时生产设置提供更适合开发人员的基于使用的定价。
这里需要注意的一点是,任何设计师、创建者或构建者(无论他们是临时的还是完全投入的软件工程师)都可以快速轻松地访问需要的所有工具、文档、示例代码、教育内容和跨平台集成功能,以便开始管理他们的数据、构建搜索前端、配置分析等等(所有这些都是免费的)。此外,他们还可以立即访问拥有500多万构建者组成的不断增长的开发人员社区。
采访者:你能讨论一下他们提供的搜索个性化工具吗?
Sean Mullaney:Algolia为公司提供了多种搜索个性化工具,帮助他们利用数据更好地改进推荐,包括不同类型的推荐和利用数据实际驱动这些推荐的独特方法。
其中的几个例子包括:
趋势:建议其他流行趋势并与客户进行的搜索相关的项目。
基于评级:人们想希望购买评分最高的产品。
个性化:根据您上次购买的产品、浏览历史、位置或其他因素,我们推荐这些产品。
这些数据驱动的方法可以根据客户与产品的互动方式,帮助快速增强和改善结果,所以更有可能推荐那些真正转化最好的产品。
Divine Assistance
采访者:你将Algolia描述为世界上最具扩展性的混合人工智能搜索引擎。Algolia是如何设计得如此高效的?
Sean Mullaney:这一切都回到了神经散列。这和尖端的解决方案可以压缩并显著加快了每个查询的速度。计算散列相似度比计算标准向量相似度要快得多,并且可以在几号秒内返回结果。
我最想关注的部分是三明治中的肉:检索。之所以说我们是唯一真正的端到端AI搜索引警,是因为在搜索行业的幕后,一直有一场将AI添加到检索中的斗争。信息检索是一个极其复杂的过程,而大规模掌握高性能、经济高效的AI检索则更为复杂。我们通过突破性的神经散列技术掌握了它。
人工智能技术在随着社会的需求变化不同而不断创新,伴随着社会架构和经济的发展,极大的促进了社会的进步和经济的发展。而人工智能搜索发展至今,技术在不断成熟完善,肖恩作为人工智能搜索重要技术人员,他现如今所在的公司Algolia,还在推出新的人工智能搜索技术,实现扩展到了企业组织上这一突破,让企业发展更加高效。相信在不久的将来人工智能搜索会惠及到人类社会的方方面面。
若您对该文章内容有任何疑问,请于我们联系,将及时回应。
关于BFT白芙堂机器人
BFT(白芙堂)机器人是智能机器人一站式服务平台,能为客户提供机器人选型、培训、解决方案、在线采购、本地化定制等高性价比的一站式服务。平台产品涵盖协作机器人、工业机器人、移动机器人、SCARA机器人、服务机器人、机器人夹爪、三维机器视觉设备、3D工业相机等十余种品类,实现机器人产业链产品全覆盖,并广泛应用于工业制造、实验室自动化、智慧零售、教育科研等行业。平台已与国内外知名机器人企业达成战略合作,并拥有专业的工程师团队,能为客户提供算法及系统定制、职校教学、科研实验室平台搭建、机器人展厅定制等服务,支持一对一技术支持和二次开发。