如何實施數據自助服務計劃
近年來,數據自助服務成為一個熱門話題。透過讓組織內不同的人員–市場營銷人員、技術人員、業務領導等–能夠存取現有數據和分析工具,您可以賦予這些業務使用者和決策者有效執行工作所需的能力。但在大多數組織中,數據自助服務仍在發展中。
根據IDG Research的最新調查,超過一半的受訪者所屬的業務線仍依賴IT或數據團隊來建立和設置BI和分析儀表板,而非自行處理這些任務。換句話說,在大多數公司中,員工無法直接存取數據或分析數據的工具。對於許多企業而言,數據自助服務是實現快速洞見時間和實時業務敏捷性的下一個里程碑。
無論是為新使用者提供更多數據存取權,還是協助傳統數據使用者執行更高級的分析任務,目標都是一樣的:讓更多人能夠快速獲取所需的資訊,而無需提交票證或等待排隊。然而,要實現更加民主化的數據和分析系統,需要策略和規劃。
以下是六個步驟,可以幫助您組織數據自助服務計劃:
將數據移至雲端
任何數據自助服務計劃都應該從認真考慮將您的數據從內部部署的數據倉庫遷移到雲端開始,或者如果您已經在雲端,就擴展雲端業務。許多實現數據自助服務的障礙都與基礎設施有關,以及無法在實際預算內快速有效地使用數據。內部部署的數據架構在處理當今的數據量和複雜性時,往往力有未逮。
建立數據和分析策略
在您的組織推進數據自助服務計劃之前,有幾個重要問題需要思考,以幫助制定一個更有可能成功並為最終使用者帶來利益的全面計劃:
- 您的組織目前處於什麼階段,未來將走向何方?
- 數據自助服務對您的組織真正意味著什麼?
- 安全性和數據管理又如何?
- 您可能會面臨哪些阻礙?
- 選擇將數據放置的位置
- 為了促進數據自助服務,您需要打破數據源之間的隔閡,並將數據集中到一個中央位置。如果該位置在雲端,您有幾種選擇方式。在將數據移至雲端時,您需要專注於存儲、數據獲取、準備和轉換。
在確定將數據以何種方式存放在雲端時,有許多因素需要考慮:
為了促進資料自助服務,您需要打破資料來源之間的界限,並將資料集中在一個中央位置。如果該位置是雲端,則有幾種選擇可供考慮。在將資料移至雲端時,您需要專注於儲存、資料獲取、準備和轉換等方面。
為了促進資料自助服務,您需要消除資料來源之間的隔閡,並將資料集中至一個中央位置。若該中央位置設於雲端,則有數種不同的架構可供選擇。在將資料移至雲端的過程中,您必須著重於資料儲存、資料獲取、資料準備及資料轉換等面向。
在移動資料至雲端時,您必須專注於資料儲存、資料取得、資料預處理和資料轉換等層面,以便打通資料來源之間的藩籬,並將資料集中至一個中樞位置,進而促進資料自助服務。若該中樞位置設於雲端環境,則有數種不同的部署方式可資選擇。
- 雲端數據倉庫還是數據湖更適合您的需求?有時,合規或監管要求會指導或規定您的選擇。
熟悉程度有多重要?例如,Amazon Redshift是基於PostgreSQL 8.0.2。一家在內部運行PostgreSQ - 數據倉庫的公司可能會更願意轉移到Amazon Redshift,因為由於共同的祖先,它們在許多方面有相似之處。
- 您目前使用哪些雲端平台/供應商服務?選擇與現有服務相關的雲端平台可能會更容易獲得信任、落地和擴展。有時,供應商提供明確的差異化優勢,這本身就可能是一個贏家。例如,如果您的公司需要以安全可靠的方式與多個第三方共享數據,Snowflake的數據共享功能可能會吸引您。
將數據帶入雲端時,您有三種主要的雲端架構選擇:
- 平台即服務(PaaS)是一種托管服務,位於雲端基礎設施內部,可為您提供可擴展性,同時也讓您保留一些控制權。例如某些雲端數據倉庫或Amazon S3儲存桶。
- 基礎設施即服務(IaaS)是來自雲端提供商(如AWS、Google Cloud或Microsoft Azure)的基礎雲端基礎設施。它允許您在雲端中設置符合需求的自己的數據基礎設施。它提供最大的控制權,但也可能是一種複雜的選擇。
- 軟件即服務(SaaS)是一種端到端的托管服務,幾乎無需維護或開銷,讓您可以專注於業務需求,而不必擔心維護技術棧。但是,您對安全性和數據存儲方式的控制權最小。
選擇您的BI和分析工具
在選擇存放數據的平台之後,請考慮您的BI和分析工具。與數據平台一樣,分析基礎設施和工具的結構也因IaaS、PaaS和SaaS而有所不同。
根據您做出的選擇,您可能能夠繼續使用部分或全部現有的ETL/報告/分析工具。但是,轉移到雲端可以讓您探索與您的數據分析需求和未來策略更加一致的新技術和產品。
PaaS:有時,內部部署服務可以被等效或類似的PaaS雲端產品所取代。例如,如果您轉移到Amazon Redshift、Snowflake或Google BigQuery等雲端數據倉庫,您可能能夠將一個CDW數據庫驅動程序加載到您的報告平台中,並繼續使用現有投資。或者,您可以有一個ELT流程,將文件直接加載到CDW中的表格。
IaaS:在IaaS中,您可以將現有的分析基礎設施移至雲端。由於拓撲結構的變化以及作為此次移動一部分而進行的任何基礎設施升級,最終用戶可能會看到性能的提高。
SaaS:一些SaaS產品附帶自己的可視化工具。與PaaS一樣,根據您的選擇,您可能能夠使用現有工具或探索替代方案。
實施和培訓
一旦選定您的雲端數據和分析平台,同樣重要的是實施解決方案並讓團隊熟練運用。
在大規模實施之前,您應該著手進行概念驗證(POC),試用這些工具並確定它們是否滿足您的要求。許多擁有內部技術團隊的公司傾向於自行進行POC。這涉及研究技術、學習使用它們並構建一個可行的最小產品。
您組織中的許多用戶在運行自己的分析和創建自己的數據可視化方面經驗有限或沒有經驗。即使您認為用戶有經驗並且會快速上手,對新工具和流程進行培訓也會令所有人受益。
建立支援架構
每個自助服務計劃都需要一個明確定義的支援架構,每個用戶都需要一條清晰的途徑來尋求所需的幫助。支援分為以下兩種類型:
- 產品和工具支援。大多數供應商都提供可訂閱的強大支援服務。大多數知名和流行的開源產品往往都有活躍的用戶論壇或付費支援。如果您有技術合作夥伴,他們也可能介入填補任何空白。
- 業務流程支援方面,幾乎不可能為最終使用者在面臨的每一種狀況或需求進行培訓。舉例來說,使用者可能需要在日常儀表板中無法獲得的資訊。為了製作臨時報告,他們需要了解底層的資料模型,才能有效地加以運用。
建立自助式資料分析平台是一個多步驟的過程,尤其是當您需要現代化資料架構以達成此目標時。請記住逐步推進:使用正確的工具將資料帶入雲端,並為分析作好準備;借重IT和資料團隊以及合作夥伴的專業知識;選擇圖形化且直覺的ETL、分析和視覺化工具,以便最終使用者操作。如果您遵循這些步驟並謹記這些事項,您就能讓組織內每一個需要資料的人都能夠取得資料。