日前,Atlassian中國合作伙伴企業日活動在上海成功舉辦。活動以“AI協同 創未來——如何利用人工智能提升團隊協作,加速產品交付”為主題,深入探討了AI技術在團隊協作與產品交付中的創新應用與實踐,吸引了眾多業內專家、企業客戶及技術開發者的積極參與。
活動現場,小米集團高級SRE孟凡胤帶來《Jira常見問題處理及如何利用AI智能客服提升效率》的精彩演講。演講從小米Jira系統的使用現狀出發,探討分享了API請求及數據治理、項目管理中的個性化設置等運維過程中的挑戰與突破,以及如何利用AI工具,深化AI智能客服應用,提高運營效率。
以下為演講回顧(內容有精簡優化):
大家好,作為Jira的使用方,今天我們主要從運維和運營兩個層面來介紹小米是如何使用Jira系統的。
小米Jira系統的使用現狀
首先,一起來了解下小米Jira系統的使用現狀。
Jira系統承擔了我們集團的手機、汽車、電視、筆記本和生態鏈各個產品的bug缺陷管理,以及米粉問題反饋的官方渠道,作為與米粉溝通的橋梁,它在小米內部扮演著至關重要的角色。
當前,我們系統的Issue數量已達到千萬級別,數據量處于業界頂端,同時項目數量也達到了1000+,項目配置復雜,個性化需求也非常多,這些都對我們的運營團隊提出了專業且嚴格的要求。隨著業務的不斷增長和復雜性的提高,我們的系統體量已經遠超官方標準產品所建議的體量,這也導致了一系列無法預知的問題。作為技術出身的系統SRE,我們致力于保證系統的SLA,確保系統的可用性,提升用戶體驗和員工的工作效率。
在龍智的協助下,我們去年花了一年時間,收集了影響系統的三十多個問題,并提出了解決方案。目前,這些方案已經落地并產生了顯著效果。
API請求及數據治理
我們遇到的第一個問題是API請求和數據治理。
隨著數據量和用戶開發請求的持續增長,我們的Search接口受到大量不規范的分析請求沖擊。這些請求中的JQL非常不規范,加上Labels數量達到了千萬級別,直接在引擎中搜索的話,很可能導致系統崩潰或嚴重的OOM問題。
▍應對措施1:代理層API限流
對于這一問題,我們首先想讓它有節制,不讓它惡意請求。我們在nginx上使用lua腳本語言對請求的QPS和IP兩種維度按照時間進行封禁。QPS達到50做一次封禁,右邊是按IP封禁,一秒請求5次,我們會封禁60秒。這樣,我們成功攔截了30%的不規范請求,緩解了部分API帶來的系統壓力。
▍應對措施2:API與web服務剝離
然而,即便進行了限流,大數據量的請求仍可能導致集群中的某個節點OOM,影響用戶訪問。那么假想一下,有沒有可能在集群當中將API和Web兩個服務分開?
在龍智的專業指導下,我們在7層代理上成功剝離了API和Web服務,確保API請求導致的系統夯住及oom不再影響到前端用戶的訪問和使用。
此外,我們還在集群上增加了狀態監控,如遇到cluster_rmi_connect_fail等異常,會觸發告警,使我們能夠實時掌握集群的狀態。
▍應對措施3:大數據治理
盡管采取了上述措施,我們仍未能完全解決API請求給系統帶來的壓力,那么就在根源上找,大家最終的訴求就是想要獲取數據,那是否可以直接給用戶提供數據呢?
大家都知道,現在是大數據時代,依托集團的數據工場,我們可以綁定mysql數據源,使用Flink SQL實時開發作業,根據不同的需求給大家提供實時數據,這樣,用戶無需再通過Search接口請求數據,極大地減輕了系統壓力。
這時候有人會問,數據推送后,我們怎樣在大數據平臺做權限管控?
對此,我們設立了專業的團隊和權限審核平臺,按照project維度開放權限。這確實需要人工操作,包括創建權限表、與需求方對接等,以確保數據的安全。雖然初期工作量較大,但隨著對工作流程的熟悉和標準化,我們已能復制和重用部分工作,從而顯著減輕后期的工作量。
▍應對措施4:統一webhook推送
在數據治理過程中,我們還注意到一個問題:當issue被更新或創建時,webhook會推送過多不規范的消息。為解決這一問題,我們統一了webhook的推送,將其統一到RocketMQ上,用戶可以直接在RocketMQ上進行消費。這一舉措不僅規范了消息推送,還允許用戶基于這些數據進行二次開發,如消息推送、看板展示和實時數據分析等。
這項工作還在持續實施當中,目前,我們已對接了大約三四十個需求,所有數據均通過統一的出口進行傳輸,同時減少了API請求,大大提高了系統的穩定性。這正是我們在運維層面所追求的:確保系統在一個更加規范、健康的環境中穩定運行。
項目管理中個性化設置
在系統運維方面,我們取得了很大的突破。其實Jira最核心的工作還是在系統配置上,Jira系統運營的工作非常的繁瑣且復雜。接下來,我將介紹一下我們如何對Jira運營的工作做精細化及規范化管理。
▍統一項目配置,一鍵創建項目
在Jira的運營方面,運營團隊大部分都是在配置項目個性化需求,創建項目,導入權限,導入模版等相關工作,同產品的project需求也不統一,這些重復性工作占用了運營團隊大量的時間。
面對這一情況,我們拉通了各個項目負責人,把同產品(例如手機,筆記本,電視等產品)SPM的需求責任到一位同學身上,把項目的配置對齊,進行統一規劃。每個產品對應了一個項目模版,由負責人在輔助系統平臺長實現一鍵創建項目、模版自動導入、權限自動導入。最終實現了統一需求、統一項目模版、統一權限,大大減少了運營工作量,提高了工作效率。
▍跨服務器Clone插件
集團中有多套Jira系統,但是系統之間的數據無法做到互通。為此,龍智為小米定制了跨服務器Clone插件。該插件通過混合使用Jira的JavaAPI、標準RestAPI和自定義RestAPI,實現了多個Jira服務器之間的Issue克隆及信息同步。
其主要功能有:
靈活的配置模式:支持多個Jira服務器之間的連接配置
支持統一認證:支持多個Jira服務器之間的SSO認證,保障各服務器之間的數據交互安全
全方位的業務映射:支持項目、問題類型、字段及字段默認值等多個維度的映射,保證不同部門之間的無縫協作
克隆信息展示:在Issue界面中展示對端服務器的克隆Issue信息,支持一鍵免登錄跳轉至對端服務器對應Issue界面,極大提升了工作效率
實時數據同步:克隆Issue有任何一方信息發生變更都會實時同步至對方,保證數據同步的時效性
AI智能客服提高運營效率
最后,為大家介紹一下我們的AI智能客服。在日常的Jira運營中,我們面臨著大量高重復性的用戶咨詢問題,Jira運營的同學逐一回答是需要付出很多的時間成本。小米一直非常重視知識庫的建設,截至目前,我們的運營相關文檔已達百余篇。
那么,如何將這這么多的文章快速、準確地傳遞給用戶?這是一個難題。傳統的機器人客服雖然可以推送相關知識,但往往無法提供精確、滿意的回答,導致用戶仍然需要花時間去篩選和尋找答案。
我們做的是讓機器人代替運營人員回答用戶的問題。
我們的AI客服解決方案利用大模型技術,將知識庫和用戶問題轉化為語義向量,通過向量匹配快速給出準確回答,實現智能客服功能。現在,我們用戶問題回答的準確率高達80%,大大釋放了運營的工作量,并且我們還在不斷收集用戶反饋,優化和更新我們的知識庫。
最后,我想說的是,Jira是一個非常有意思的產品,值得我們去深入挖掘。Jira也是一項需要長期維護的工程,依靠個人的力量是遠遠不夠的,我們也需要與更專業、更精細、更系統的團隊共同進步。也非常感謝龍智提供這次分享的機會,期待未來我們能夠有更緊密、更專注的合作。
審核編輯 黃宇
-
API
+關注
關注
2文章
1485瀏覽量
61817 -
AI
+關注
關注
87文章
30146瀏覽量
268418 -
jira
+關注
關注
0文章
12瀏覽量
2196
發布評論請先 登錄
相關推薦
評論