經過幾年的積累,大部分中大型的企事業(yè)單位已經建立了比較完善的CRM、ERP和OA等基礎信息化系統(tǒng)。這些系統(tǒng)的統(tǒng)一特點是:業(yè)務人員或者用戶對數據庫進行大量的增加、修改和刪除等操作,即聯機事務處理(Online Transaction Process,OLTP)。系統(tǒng)運行了一段時間以后,必然幫助企事業(yè)單位收集大量的歷史數據。但是。在數據庫中分散、獨立存在的大量數據對于業(yè)務人員來說,只是一些無法看懶的天書。此時,如何把數據轉化為業(yè)務人員(包括管理者)能夠看懂的有用信息,充分掌握、利用這些信息,并且輔助決策,就是商業(yè)智能要解決的主要問題。
商業(yè)智能的實現有三個層次:數據報表、多維數據分析和數據挖掘。
1)數據報表
如何把數據庫中存在的數據轉變?yōu)闃I(yè)務人員需要的信息?大部分的答案是報表系統(tǒng)。簡單說,報表系統(tǒng)是BI的低端實現。傳統(tǒng)的報表系統(tǒng)技術上已經相當成熟,大家熟悉的Excel、水晶報表和Reporting Service等都已經被廣泛使用。但是,隨著數據的增多,需求的提高,傳統(tǒng)報表系統(tǒng)面臨的挑戰(zhàn)也越來越多。
?。?)數據太多,信息太少。密密麻麻的表格堆砌了大量數據。到底有多少業(yè)務人員細看過每一個數據?到底這些數據代表了什么信息、什么趨勢?級別越高的領導,越需要簡明的信息。
?。?)難以交互分析、了解各種組合。定制好的報表過于死板。例如,我們可以在一張表中列出不同地區(qū)、不同產品的銷量,另一張表中列出不同地區(qū)、不同年齡段顧客的銷量。但是,這兩張表無法回答諸如“華北地區(qū)中青年顧客購買數碼相機類型產品的情況”等問題。業(yè)務問題經常需要多個角度的交互分析。
?。?)難以挖掘出潛在的規(guī)則。報表系統(tǒng)列出的往往是表面上的數據信息,但是海量數據深處含有哪些潛在規(guī)則呢?什么客戶對我們價值最大?產品之間相互關聯的程度如何‘越是深層的規(guī)則,對于決策支持的價值越大,但是,也越難挖掘出來。
?。?)難以追溯歷史,形成數據孤島。長期運行中產生的數據往往存在于不同地方,太舊的數據(例如一年前的數據)可能已被業(yè)務系統(tǒng)備份出去,導致宏觀分析、長期歷史分析難度很大。
顯然,隨著時代的發(fā)展,傳統(tǒng)報表系統(tǒng)已經不能滿足日益增長的業(yè)務需求了,企業(yè)期待著新的技術。數據分析和數據挖掘的時代正在來臨。值得注意的是,數據分析和數據挖掘系統(tǒng)的目的是帶給我們更多的決策支持價值,并不是取代數據報表。報表系統(tǒng)依然有其不呵取代的優(yōu)勢,并且將會長期與數據分析、挖掘系統(tǒng)一起并存下去。
2)多維數據分析
如果說在線事務處理(OLTP)側重于對數據庫進行增加、修改和刪除等日常事務操作,在線分析處理則側重于針對宏觀問題全面分析數據,獲得有價值的信息。
為了達到OLAP的目的,傳統(tǒng)的關系型數據庫已經不夠了,需要一種新的技術叫做多維數據庫。
多維數據庫的概念并不復雜。舉一個例子,我們想描述2003年4月份可樂在北部地區(qū)銷售額10萬元時,涉及到幾個角度:時間、產品和地區(qū)。這些叫做維度。至于銷售額,叫做度量值。當然,還有成本、利潤等。
除了時間、產品和地區(qū),我們還可以有很多維度,例如客戶的性別、職業(yè)、銷售部門和促銷方式等。實際上,使用中的多維數據庫可能是一個8維或者15維的立方體。雖然結構上15維的立方體很復雜,但是概念上非常簡單。
數據分析系統(tǒng)的總體架構分為4個部分:源系統(tǒng)、數據倉庫、多維數據庫和客戶端。
①源系統(tǒng):包括現有的所有OLTP系統(tǒng),搭建BI系統(tǒng)并不需要更改現有系統(tǒng)。
?、跀祿}庫:數據大集中,通過數據抽取,把數據從源系統(tǒng)源源不斷地抽取出來,可能每天一次,或者每3個小時一次,當然是自動的。數據倉庫依然建立在關系型數據庫上,往往符合“星型結構”模型。
③多維數據庫:數據倉庫的數據經過多維建模,形成了立方體結構。每一個立方體描述了一個業(yè)務主題,例如銷售、庫存或者財務。
?、芸蛻舳耍汉玫目蛻舳塑浖梢园讯嗑S立方體中的信息豐富多彩地展現給用戶。
3)數據挖掘
廣義上說,任何從數據庫中挖掘信息的過程都州做數據挖掘。從這點看來,數據挖掘就是BI.但從技術術語上說,數據挖掘(Data Mining)指的是:源數據經過清洗和轉換等成為適合于挖掘的數據集。數據挖掘在這種具有固定形式的數據集上完成知識的提煉,最后以合適的知識模式用于進一步分析決策工作。從這種狹義的觀點上,我們可以定義:數據挖掘是從特定形式的數據集中提煉知識的過程。數據挖掘往往針對特定的數據、特定的問題,選擇一種或者多種挖掘算法,找到數據下面隱藏的規(guī)律,這些規(guī)律往往被用來預測、支持決策。
現舉一個關聯銷售的案例。美國的超市有這樣的系統(tǒng):當你采購了一車商品結賬時,售貨員小姐掃描完了你的產品后,計算機上會顯示出一些信息,然后售貨員會友好地問你:我們有一種一次性紙杯正在促銷,位于F6貨架上,您要購買嗎?這句話絕不是一般的促銷。因為計算機系統(tǒng)早就算好了,如果你的購物車中有餐巾紙、大瓶可樂和沙拉,則86%的可能性你要買一次性紙杯。結果是你說:“啊,謝謝你,我剛才一直沒找到紙杯。”
這不是什么神奇的科學算命,而是利用數據挖掘中的關聯規(guī)則算法實現的系統(tǒng)。
每天,新的銷售數據會進入挖掘模型,與過去N天的歷史數據一起被挖掘模型處理,得到當前最有價值的關騏規(guī)則。同樣的算法,分析網上書店的銷售業(yè)績,計算機可以發(fā)現產品之間的關聯以及關聯的強弱。
商業(yè)智能的基本概念:http://www.conferencecallsmadeeasy.com/pm/8184.html
商業(yè)智能系統(tǒng)應具有的主要功能:http://www.conferencecallsmadeeasy.com/pm/8183.html
商業(yè)智能的三個層次:http://www.conferencecallsmadeeasy.com/pm/8181.html
商業(yè)智能的軟件工具集合:http://www.conferencecallsmadeeasy.com/pm/8185.html
實施商業(yè)智能的步驟:http://www.conferencecallsmadeeasy.com/pm/8186.html
溫馨提示:因考試政策、內容不斷變化與調整,信管網網站提供的以上信息僅供參考,如有異議,請以權威部門公布的內容為準!
信管網致力于為廣大信管從業(yè)人員、愛好者、大學生提供專業(yè)、高質量的課程和服務,解決其考試證書、技能提升和就業(yè)的需求。
信管網軟考課程由信管網依托10年專業(yè)軟考教研傾力打造,官方教材參編作者和資深講師坐鎮(zhèn),通過深研歷年考試出題規(guī)律與考試大綱,深挖核心知識與高頻考點,為學員考試保駕護航。面授、直播&錄播,多種班型靈活學習,滿足不同學員考證需求,降低課程學習難度,使學習效果事半功倍。
發(fā)表評論 查看完整評論 | |