理解elasticsearch相关性 - 温启东 - 茵科美信 - Double 6

Shell
- 一些常用的Shell脚本
- 关于Shell中一个中括号[]和两个中括号[[]]
- Mac系统设置ssh心跳，保持ssh连接
Mac
- mac 上用 brew 命令安装 php
- Mac 配置 github ssh key免输账号密码提交代码
andriod
- andriod studio webview 去除页面标题栏
- andriod webview 提示：ERR_CLEARTEXT_NOT_PERMITTED
- android webview返回时不退出
mqtt
- MQTT入门介绍
- eclipse-mosquitto MQTT发布/订阅测试
React Native
- React-Native学习指南
Git
- git给github设置代理
- git命令清单
- git只合并另一个分支上特定的文件
- git 子模块的使用
- git命令教程
Nginx
- nginx内置变量
Redis
- phpredis中文手册—《redis中文手册》 php版
- Redis查看状态
HTML
- H5从相册选择图片和从摄像头选择图片
Elasticsearch
- 理解elasticsearch相关性
- elasticsearch集群体验
- elasticsearch常用命令
- 给站点做一个全站相关性搜索
- 在mac上使用docker测试filebeat+logstash+elastchsearch+kibana收集分析nginx日志
Linux
- 查看centos版本信息
- centos多PHP版本，使用composer
- linux下创建 rsa 添加github
- linux上查看文件夹占用空间大小
- linux软链接创建、删除与修改
- vi编辑器显示与隐藏行号
- mac上查看端口被哪个程序占用
- 给某个特定的用户授予某个特定文件夹的权限
- 在Linux上查看CPU，内存等信息
- linux上查看磁盘分区，网络配置，端口使用情况
- linux查看历史命令 history
- grep命令详解
- Centos普通用户不能使用docker命令的问题
- centos添加RSA证书设置用户免密码登陆
- Cenos上使用yum安装MySQL8
Docker
- 用Dockerfile建一个PHP7+Swoole环境
- 用阿里云的容器镜像服务
- Alpine 安装PHP扩展遇到的坑
- 从php官方镜像创建php:7.1.27-fpm-alpine3.8
- php7.1-memcached-redis-gettext
- Docker centos:latest install PHP7.1.28
- 用docker升级站点环境
- docker 列表容器 IP
- 查看docker当前建立的网络
- 在容器中访问宿主机服务
- docker-compose挂载mysql遇到ownership权限问题
- Docker 入门
- Dockerfile语法
Python
- 让python在后台运行
- 做一个词云图服务
- Day-5: python3 OS模块
- Python 让数据可视化
- Python Scapy爬虫
- Day-6: python3 数据分析6个主要模块
- Day-6: python3 安装PyMySQL连接MySQL
- Day-6: python3 正则表达式
- Day-6: python3 标准库概览
- Day-5: python3 面向对象与类
- Day-5: python3 错误与异常
- Python学习之路
- Day-5: python3 输入和输出
- Day-5: python3 模块
- Day-4: python3 函数
- Day-4: python3 迭代器和生成器
- Day-4: python3 循环语句
- Day-4: python3 条件控制语句
- Day-4: Python3 数据类型转换
- Day-3: python3 数据类型
- Day-2: 中文编码与基础语法
- Day-1: 先看一下mac自带的Python
MySQL
- mysql导出
- MySQL从第1张表中选择字段插入第2张表
- 58到家数据库30条军规解读
- 项目中常用的19条MySQL优化技巧
- MySQL查看锁情况
- mysql中bigint、int、mediumint、smallint 和 tinyint的取值范围
- Sql语句的执行顺序
- Mysql 大表更新
- MySQL 统计某个enum字段中各个值的出现次数
- mysql group by 输出最新的id
Js
- $.ajax() 参数详解
- 在Element+Vue中引入jQuery
- javascript把时间戳格式化为时间
- Element table 对单元格的数据格式化
- element table点击某一行时，展开当前点击的行
- 使用jquery给页面添加全局ajax判断
- 在Element Vue 子组件中调用父组件的方法
- Javascript取当前时间戳
- Javascript实现PHP的ip2long() 和 long2ip()
- js数组遍历方法总结
- 使用jquery的ajax上传图片
- 截屏图片通过粘贴到输入框上传图片
- js读取本地文件
- ajax提交json格式的数据
PHP
- 定时任务执行PHP时提示Redis not found
- PHP 注解
- PHP curl 访问需要用户密码的URL
- swoft文件上传
- centos上安装composer
- 安装swoole过程中遇到的问题
- centos7.6安装PHP74
- 在新的ECS centos7.6上安装PHP环境
- PHP单元测试
- PHP在日期计算时遇到31号减一个月还在当月
- PHP对二维数组按指定字段排序
- PHP 通过get_browser取流览器信息
- 安装mongodb扩展
- PHP GMT时间
- PHP手册(工具)
- 用Swoole造一个websocket服务
- 脚本文件首行声明
- PHP CURL并发请求测试
- PHP 的几种CURL请求方式
- PHP提示Too many open files错误
- PHP取客户端的IP
- PHP openssl_encrypt加密
- 创建RSA公钥、私钥证书
- PHP延时函数做秒级、毫秒级、微秒级延时
- web安全验证
- PHP 使用xdebug性能分析
- 取数组第1个或最后1个元素
- PHP判断客户端协议类型是http还是https
- 重启swoole服务
- PHP po/mo 多语言支持
小程序
- 微信小程序将本地tempImage转换为base64
NodeJs
- NodeJs扫盲第1篇
- docker-compose 布署nodejs应用
- 了解nodejs中模块的概念
- NodeJs扫盲小结
- 代码的组织和部署
- nodejs的包管理工具npm
- nodejs文件操作
- NodeJs几个和文件操作相关的API
- NodeJs文件操作之目录遍历
- NodeJs文件操作之文本编码
- NodeJs文件操作学习小结
- NodeJs网络操作开篇
- NodeJs网络操作相关API
- NodeJs网络操作入门小结
- NodeJs进程管理开篇
- NodeJs进程管理应用场景
- NodeJs异步编程开篇
- NodeJs异步编程陷阱与小结
- NodeJs中的async/await声明
- NodeJs异步处理的演进
Golang
- Golang从入门到跑路
- Go 开发者成长路线图，指导Go开发者学习
- Go的知识图谱
Blog
- 写给自己
Others
- 自学成材
- win10 安装 nvm 安装ndoe 多版本
- 在linux下创建自定义服务
- 下载m3u8的视频
- PHP技术详解
- 分布式事务方案
- 富文本Editor汇总
- 解除Time Machine封印，提升备份速度
- 制作macOS启动盘
- mac装机必备工具
- RabbitMQ相关词汇解释
- RabbitMQ实时消息推送
- SS/SSR简介
- Mac苹果电脑常用快捷键
- postman中配置自动计算签名
- 佛曰
- 增值电信业务经营许可证
- 阿里云oss上传视频取第一帖作为缩略图
- 开发入门
- API开发
- Double-6 Space
- online service
- 挪车牌：升级维护
- 企业年报填写须知
- CSS文本光线扫码特效
- Mac memcached 启动
- 程序员的瑞士军刀——正则表达式
- 文档编写之Markdown
- 慧易小程序安装指南
- Contact Me

Elasticsearch相关性

elasticsearch的返回结果默认会按相关性得分(_score)的倒序排列

每个文档都有相关性评分，用一个正浮点数字段 _score 来表示。 _score 的评分越高，相关性越高。

查询语句会为每个文档生成一个 _score 字段。评分的计算方式取决于查询类型不同的查询语句用于不同的目的： fuzzy 查询会计算与关键词的拼写相似程度，terms 查询会计算找到的内容与关键词组成部分匹配的百分比，但是通常我们说的 relevance 是我们用来计算全文本字段的值相对于全文本检索词相似程度的算法。

Elasticsearch 的相似度算法被定义为检索词频率/反向文档频率， TF/IDF ，包括以下内容：

检索词频率

检索词在该字段出现的频率？出现频率越高，相关性也越高。字段中出现过 5 次要比只出现过 1 次的相关性高。
反向文档频率

每个检索词在索引中出现的频率？频率越高，相关性越低。检索词出现在多数文档中会比出现在少数文档中的权重更低。
字段长度准则

字段的长度是多少？长度越长，相关性越低。检索词出现在一个短的 title 要比

单个查询可以联合使用 TF/IDF 和其他方式，比如短语查询中检索词的距离或模糊查询里的检索词相似度。

相关性并不只是全文本检索的专利。也适用于 yes|no 的子句，匹配的子句越多，相关性评分越高。

如果多条查询子句被合并为一条复合查询语句，比如 bool 查询，则每个查询子句计算得出的评分会被合并到总的相关性评分中。

https://blog.csdn.net/qq_41455420/article/details/79612175

Elastichsearch权威指南 https://www.elastic.co/guide/cn/elasticsearch/guide/current/getting-started.html