国产一级人爱无码视频_在线中文字幕亚洲日韩不卡_免费永久看黄a片在线观看_福利午夜757久久久_99国产这里只有精品视频播放_少妇熟女视频一区二区_亚洲国产户外视频_看全色黄大色黄大片爽一次_精品在线播放亚洲

認(rèn)識倒排索引
分布式架構(gòu)原理
寫入數(shù)據(jù)的工作原理
寫數(shù)據(jù)底層原理
讀取數(shù)據(jù)的工作原理
搜索工作原理
刪除/更新數(shù)據(jù)底層原理

ES 的集群模式和 kafka 很像，kafka 又和 redis 的集群模式很像。總之就是相互借鑒！

不管你用沒用過 ES，今天我們一起聊聊它。就當(dāng)擴(kuò)展大家的知識廣度了！

認(rèn)識倒排索引

「正排索引 VS 倒排索引：」

正排索引 VS 倒排索引

「倒排索引包括兩個部分：」

單詞詞典（Term Dictionary）：記錄所有文檔的單詞，記錄單詞到倒排列表的關(guān)聯(lián)關(guān)系

?

單詞詞典一般比較大，可以通過 B+ 樹或哈希拉鏈法實(shí)現(xiàn)，以滿足高性能的插入與查詢

?
倒排列表（Posting List）：記錄了單詞對應(yīng)的文檔結(jié)合，由倒排索引項（Posting）組成：
- 文檔 ID
詞頻 TF：該單詞在文檔中出現(xiàn)的次數(shù)，用于相關(guān)性評分
位置（Position）：單詞在文檔中分詞的位置。用于語句搜索（Phrase Query）
偏移（Offset）：記錄單詞的開始結(jié)束位置，實(shí)現(xiàn)高亮顯示

倒排索引

「ElasticSearch 的倒排索引：」

ElasticSearch 的 JSON 文檔中的每個字段，都有自己的倒排索引

可以針對某些字段不做索引
- 優(yōu)點(diǎn)：節(jié)省存儲空間
- 缺點(diǎn)：字段無法被搜索

基于 Spring Boot + MyBatis Plus + Vue & Element 實(shí)現(xiàn)的后臺管理系統(tǒng) + 用戶小程序，支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

項目地址：https://github.com/YunaiV/ruoyi-vue-pro

視頻教程：https://doc.iocoder.cn/video/

分布式架構(gòu)原理

「分片 shard：一個索引可以拆分成多個 shard 分片。」

主分片 primary shard：每個分片都有一個主分片。
備份分片 replica shard：主分片寫入數(shù)據(jù)后，會將數(shù)據(jù)同步給其他備份分片。

將 ES 集群部署在 3個機(jī)器上（esnode1、esnode2、esnode3）：

「創(chuàng)建個索引，分片為 3 個，副本數(shù)設(shè)置為 1：」

PUT/sku_index/_settings
{
"settings":{
"number_of_shards":3,
"number_of_replicas":1
}
}

響應(yīng)：
{
"acknowledged":true
}

分布式架構(gòu)原理

「ES 集群中有多個節(jié)點(diǎn)，會自動選舉一個節(jié)點(diǎn)為 master 節(jié)點(diǎn)，如上圖的 esnode2節(jié)點(diǎn)：」

主節(jié)點(diǎn)（master）：管理工作，維護(hù)索引元數(shù)據(jù)、負(fù)責(zé)切換主分片和備份分片身份等。
從節(jié)點(diǎn)（node）：數(shù)據(jù)存儲。

「集群中某節(jié)點(diǎn)宕機(jī)：」

主節(jié)點(diǎn)宕機(jī)：會重新選舉一個節(jié)點(diǎn)為主節(jié)點(diǎn)。
從節(jié)點(diǎn)宕機(jī)：由主節(jié)點(diǎn)，將宕機(jī)節(jié)點(diǎn)上的主分片身份轉(zhuǎn)移到其他機(jī)器上的備份分片上。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實(shí)現(xiàn)的后臺管理系統(tǒng) + 用戶小程序，支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

項目地址：https://github.com/YunaiV/yudao-cloud

視頻教程：https://doc.iocoder.cn/video/

寫入數(shù)據(jù)的工作原理

「寫單個文檔所需的步驟：」

客戶端選擇一個 Node 發(fā)送請求，那么這個 Node 就稱為 「協(xié)調(diào)節(jié)點(diǎn)（Coorinating Node）」 。
Node 使用文檔 ID 來確定文檔屬于分片 0，通過集群狀態(tài)中的內(nèi)容路由表信息獲知分片0 的主分片在 Node1 上，因此將請求轉(zhuǎn)發(fā)到 Node1 上。
Node1 上的主分片執(zhí)行寫操作。如果寫入成功，則將請求并行轉(zhuǎn)發(fā)到 Node3 的副分片上，等待返回結(jié)果。

當(dāng)所有的副分片都報告成功，Node1 將向 Node （協(xié)調(diào)節(jié)點(diǎn)）報告成功。

寫入數(shù)據(jù)的工作原理

「Tips：客戶端收到成功響應(yīng)時，意味著寫操作已經(jīng)在主分片和所有副分片都執(zhí)行完成。」

寫數(shù)據(jù)底層原理

「寫操作可分為 3 個主要操作：」

寫入新文檔： 這時候搜索，是搜索不到。

將數(shù)據(jù)寫入內(nèi)存

將這操作寫入 translog 文件中

refresh 操作： 默認(rèn)每隔 1s ，將內(nèi)存中的文檔寫入文件系統(tǒng)緩存（filesystem cache）構(gòu)成一個 segment

?

這時候搜索，可以搜索到數(shù)據(jù)。

?

「1s 時間：ES 是近實(shí)時搜索，即數(shù)據(jù)寫入 1s后可以搜索到。」

flush 操作： 默認(rèn)每隔 30 分鐘或者 translog 文件 512MB ，將文件系統(tǒng)緩存中的 segment 寫入磁盤，并將 translog 刪除。

「translog 文件：」 來記錄兩次 flush(fsync) 之間所有的操作，當(dāng)機(jī)器從故障中恢復(fù)或者重啟，可以根據(jù)此還原

translog 是文件，存在于內(nèi)存中，如果掉電一樣會丟失。
「默認(rèn)每隔 5s 刷一次到磁盤中」

讀取數(shù)據(jù)的工作原理

「讀取文檔所需的步驟：」

客戶端選擇一個 Node 發(fā)送請求，那么這個 Node 就稱為 「協(xié)調(diào)節(jié)點(diǎn)（Coorinating Node）」 。
Node 使用文檔 ID 來確定文檔屬于分片 0，通過集群狀態(tài)中的內(nèi)容路由表信息獲知分片0 有 2 個副本數(shù)據(jù)（一主一副），會使用隨機(jī)輪詢算法選擇出一個分片，這里將請求轉(zhuǎn)發(fā)到 Node1
Node1 將文檔返回給 Node，Node 將文檔返回給客戶端。

讀取數(shù)據(jù)的工作原理

「在讀取時，文檔可能已經(jīng)存在于主分片上，但還沒有復(fù)制到副分片，這種情況下：」

讀請求命中副分片時，可能會報告文檔不存在。
讀請求命中主分片時，可能成功返回文檔。

搜索工作原理

「搜索數(shù)據(jù)過程：」

客戶端選擇一個 Node 發(fā)送請求，那么這個 Node 就稱為 「協(xié)調(diào)節(jié)點(diǎn)（Coorinating Node）」 。
Node 協(xié)調(diào)節(jié)點(diǎn)將搜索請求轉(zhuǎn)發(fā)到所有的分片（shard）：主分片或副分片，都可以。
「query 階段」 ：每個分片 shard 將自己的搜索結(jié)果（文檔 ID）返回給協(xié)調(diào)節(jié)點(diǎn)，由協(xié)調(diào)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的合并、排序、分頁等操作，產(chǎn)出最終結(jié)果。
「fetch 階段」 ：由協(xié)調(diào)節(jié)點(diǎn)根據(jù) 文檔 ID 去各個節(jié)點(diǎn)上拉取實(shí)際的文檔數(shù)據(jù)。

搜索工作原理

舉個栗子： 有 3 個分片，查詢返回前 10 個匹配度最高的文檔

每個分片都查詢出當(dāng)前分片的 TOP 10 數(shù)據(jù)
「協(xié)調(diào)節(jié)點(diǎn)」 將 3 * 10 = 30 的結(jié)果再次排序，返回最終 TOP 10 的結(jié)果。

刪除/更新數(shù)據(jù)底層原理

「刪除操作」 ：commit 的時候會生成一個 .del 文件，里面將某個 doc 標(biāo)識為 deleted 狀態(tài)，那么搜索的時候根據(jù) .del 文件就知道這個 doc 是否被刪除了。
「更新操作」 ：就是將原來的 doc 標(biāo)識為 deleted 狀態(tài)，然后新寫入一條數(shù)據(jù)。

「底層邏輯是：」

Index Buffer 每次 refresh 操作，就會產(chǎn)生一個 segment file。（默認(rèn)情況：1秒1次）
定制執(zhí)行 merge 操作：將多個 segment file 合并成一個，同時將標(biāo)識為 deleted 的 doc 「物理刪除」 ，將新的 segment file 寫入磁盤，最后打上 commit point 標(biāo)識所有新的 segment file。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
6909

瀏覽量
88850
spring

spring

+關(guān)注

關(guān)注
0

文章
338

瀏覽量
14312

原文標(biāo)題：一文輕松圖解搞懂Elasticsearch原理！

文章出處：【微信號：芋道源碼，微信公眾號：芋道源碼】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Elasticsearch 再次開源

Elasticsearch 和 Kibana 又可以被稱為開源了。很難表達(dá)這句話讓我有多高興。我激動得簡直要跳起來了。我們 Elastic 的所有人都是如此。開源是我的 DNA。這也是Elastic的DNA。能夠再次將 Elasticsearch 稱為開源，我感到非常高興

發(fā)表于 11-13 12:14 ?92次閱讀

<b class='flag-5'>Elasticsearch</b> 再次開源

【書籍評測活動NO.50】親歷芯片產(chǎn)線，輕松圖解芯片制造，揭秘芯片工廠的秘密

產(chǎn)業(yè)運(yùn)營等)感興趣的IC從業(yè)者和大眾讀者。相信閱讀過《芯路》《半導(dǎo)體簡史》《圖解入門半導(dǎo)體》等書的讀者一定也會對本書倍感興趣。圖書簡介本書是一本關(guān)于半導(dǎo)體芯片制造全景的入門書。本書以

發(fā)表于 11-04 15:38

一文搞懂Linux進(jìn)程的睡眠和喚醒

一、常見的進(jìn)程狀態(tài)與理解在操作系統(tǒng)內(nèi)部，有專門用來管理進(jìn)程的結(jié)構(gòu)體，叫做struct task_struct，也稱作進(jìn)程控制塊（PCB），主要包含描述進(jìn)程的相關(guān)信息，如進(jìn)程用戶、進(jìn)程狀態(tài)、進(jìn)程

發(fā)表于 11-04 15:15

一文搞懂用ZPC輕松拿捏數(shù)據(jù)上云

ZPC是ZLG全新研發(fā)的顯控一體機(jī)。開源AWTK，版權(quán)無憂！AWFlow流圖編程，開發(fā)很簡單！多種通信協(xié)議，設(shè)備互聯(lián)超便捷！更有ZWS，數(shù)據(jù)上云很輕松！本文將介紹ZPC輕松拿捏數(shù)據(jù)上云。ZPC簡介

發(fā)表于 09-05 08:05 ?280次閱讀

統(tǒng)一日志數(shù)據(jù)流圖

統(tǒng)一日志數(shù)據(jù)流圖日志系統(tǒng)數(shù)據(jù)流圖系統(tǒng)進(jìn)行日志收集的過程可以分為三個環(huán)節(jié)： (1)日志收集和導(dǎo)入ElasticSearch (2)ElasticSearch進(jìn)行索引等處理 (3)可視化操作，查詢等

發(fā)表于 08-21 15:00 ?278次閱讀

PCB阻抗設(shè)計12問，輕松帶你搞懂阻抗！

阻抗，工程師們都接觸過，但能把阻抗說清楚的工程師少之又少。阻抗看似簡單，實(shí)則難以言表。下面我們用快問快答的方式，輕松幫你搞懂阻抗！ 01 問：什么是阻抗？答：在有電阻、電感和電容的電路里

發(fā)表于 06-11 10:21

一文搞懂DDR內(nèi)存原理

內(nèi)存(DRAM-RandomAccessMemory)作為當(dāng)代數(shù)字系統(tǒng)最主要的核心部件之一，從各種終端設(shè)備到核心層數(shù)據(jù)處理和存儲設(shè)備，從各種消費(fèi)類電子設(shè)備到社會各行業(yè)專用設(shè)備，是各種級別的CPU進(jìn)行

發(fā)表于 05-09 17:09 ?2147次閱讀

Rust編寫的首個Postgres基礎(chǔ)Elasticsearch開源替代品問世

，F(xiàn)irebase 開源替代 Supabase，AirTable 開源替代 NocoDB，等等等等，現(xiàn)在又多了 ElasticSearch 開源替代 —— ParadeDB。

發(fā)表于 02-22 11:34 ?790次閱讀

文心一言APP上線數(shù)字分身功能

文心一言APP近日上線了一項令人興奮的新功能——數(shù)字分身。這一功能允許用戶輕松創(chuàng)建自己的個性化虛擬形象，為用戶帶來全新的互動體驗。

發(fā)表于 02-04 10:32 ?1136次閱讀

PCB阻抗設(shè)計12問，輕松帶你搞懂阻抗！

阻抗，工程師們都接觸過，但能把阻抗說清楚的工程師少之又少。阻抗看似簡單，實(shí)則難以言表。下面我們用快問快答的方式，輕松幫你搞懂阻抗！ 01 問：什么是阻抗？答：在有電阻、電感和電容的電路里，對交流電所

發(fā)表于 01-05 10:50

PCB阻抗設(shè)計12問，輕松帶你搞懂阻抗！

阻抗，工程師們都接觸過，但能把阻抗說清楚的工程師少之又少。阻抗看似簡單，實(shí)則難以言表。下面我們用快問快答的方式，輕松幫你搞懂阻抗！01問：什么是阻抗？答：在有電阻、電感和電容的電路里，對交流電所起

發(fā)表于 01-05 10:44 ?1889次閱讀

【華秋干貨鋪】PCB阻抗設(shè)計12問，輕松帶你搞懂阻抗

阻抗，工程師們都接觸過，但能把阻抗說清楚的工程師少之又少。阻抗看似簡單，實(shí)則難以言表。下面我們用快問快答的方式，輕松幫你搞懂阻抗！ 0 1 問：什么是阻抗？答：在有電阻、電感和電容的電路里

發(fā)表于 01-05 08:45 ?967次閱讀

PCB阻抗設(shè)計12問，輕松帶你搞懂阻抗！

阻抗，工程師們都接觸過，但能把阻抗說清楚的工程師少之又少。阻抗看似簡單，實(shí)則難以言表。 ? 下面我們用快問快答的方式，輕松幫你搞懂阻抗！ 0 1 ?? 問：什么是阻抗？ ? 答：在有電阻、電感和電容

發(fā)表于 01-03 08:40 ?1135次閱讀

一文搞懂電器控制圖設(shè)計原理

為了表達(dá)電氣控制系統(tǒng)的設(shè)計意圖,便于分析系統(tǒng)工作原理、安裝、調(diào)試和檢修控制系統(tǒng),必須采用統(tǒng)一的圖形符號和文字符號來表達(dá)。

發(fā)表于 12-26 11:37 ?439次閱讀

你還是分不清多進(jìn)程和多線程嗎？一文搞懂！

你還是分不清多進(jìn)程和多線程嗎？一文搞懂！多進(jìn)程和多線程是并發(fā)編程中常見的兩個概念，它們都可以用于提高程序的性能和效率。但是它們的實(shí)現(xiàn)方式和使用場景略有不同。 1. 多進(jìn)程：多進(jìn)程指的是在操作系統(tǒng)

發(fā)表于 12-19 16:07 ?540次閱讀