感谢本站的朋友StarCoder的线索传递!

阿里开源自研搜索引擎Havenask,已用于淘宝、高德、饿了么等

阿里巴巴已经开放了自己的搜索引擎Havenask,项目文件已经在GitHub上线。

据仓库介绍,Havenask是阿里巴巴集团自主研发的搜索引擎,也是阿里巴巴内部广泛使用的大型分布式搜索系统它支持包括淘宝,天猫,菜鸟,高德,饿了么,全球化在内的整个阿里巴巴集团的搜索业务,为用户提供高性能,低成本,易用的搜索服务

同时,Havenask具有灵活的定制和开发能力,支持算法的快速迭代,帮助客户和开发者量身定制适合自身业务的智能搜索服务,从而助力业务增长。

根据介绍,Havenask的核心能力和优势如下:

极致工程性能:支持千亿级实时数据检索,百万级QPS查询,百万级TPS写入,毫秒级查询延迟和秒级数据更新。

C++的底层构造:对性能,内存,稳定性有更高的保障。

查询支持:支持SQL语法,方便查询,查询体验更友好。

丰富的插件机制:支持各种业务插件,扩展性强。

支持图形开发:算法可分分钟快速迭代,定制能力丰富,在新一代智能检索场景中支持效果极佳。

支持向量检索:配合插件可以实现多模态搜索,满足更多场景下构建搜索服务的需求。

本站了解到,引擎的底层主要是用C++和少量Python语言编写的,所以需要在Docker容器中运行机器内存需要大于10GB,CPU大于2核,磁盘大小大于50GB

GitHub页面:点击这里查看