- 相關(guān)推薦
關(guān)于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)研究論文
1.數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)挖掘概述
所謂數(shù)據(jù)挖掘就是指在眾多數(shù)據(jù)中抽取有用資料的過程,這些有用的資料是在海量數(shù)據(jù)中經(jīng)過篩選、過濾、清洗、提取出來的,能體現(xiàn)客戶潛在需求。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析相比,數(shù)據(jù)挖掘具有預(yù)知性、有效性和實(shí)用性等特點(diǎn)。傳統(tǒng)的數(shù)據(jù)分析則是定向分析、費(fèi)用高、不能及時有效的提供相關(guān)數(shù)據(jù),具有一定的局限性。而數(shù)據(jù)挖掘通過利用多種分析工具,來對大量的數(shù)據(jù)進(jìn)行抽取分析,發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的關(guān)系或規(guī)則,對商業(yè)決策具有重要支持性作用。
1.2數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘往往有兩類任務(wù):一是描述,二是預(yù)測。對于描述性任務(wù)幾乎都是利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)刻畫其普遍特性,而預(yù)測性任務(wù)則是根據(jù)現(xiàn)有的數(shù)據(jù)進(jìn)行分析預(yù)測。當(dāng)前,數(shù)據(jù)挖掘功能有以下幾類:
1.2.1利用概念描述發(fā)現(xiàn)廣義知識
通過對某類對象進(jìn)行細(xì)致描述,從而對該數(shù)據(jù)進(jìn)行概括、提煉。而概念描述又分為兩類,一種是描述同類對象的共性,即為特征性描述。另一種是描述異類對象的異性,即為區(qū)別性描述。
1.2.2利用關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)知識
利用不同變量的取值,發(fā)現(xiàn)他們存在某種關(guān)系,而這往往是屬于被發(fā)現(xiàn)的重要資料。這種關(guān)聯(lián)往往分成三類,即簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián),等等。
1.2.3利用分類和聚類方法發(fā)現(xiàn)分類知識
將數(shù)據(jù)對象分類或者將數(shù)據(jù)對象分成多個簇,來發(fā)現(xiàn)其同類對象的共性和異類對象的異性相關(guān)知識。
1.2.4利用預(yù)測方法獲取預(yù)測型知識
利用過去或者當(dāng)前的與時間有關(guān)的數(shù)據(jù)對未來的相關(guān)數(shù)據(jù)進(jìn)行推測。
1.2.5采用偏差檢測來獲取偏差型知識
利用數(shù)據(jù)庫中的異常數(shù)據(jù)進(jìn)行分析,解釋出現(xiàn)異常現(xiàn)象的原因。
1.3數(shù)據(jù)挖掘過程
從查找數(shù)據(jù)開始,通過一定的算法或模型發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性,并提取出新的知識或規(guī)律,從而得出新的結(jié)論。這一流程包括以下幾個步驟:首先,提出陳述的問題和要闡明的假設(shè),從中發(fā)現(xiàn)問題,提出假設(shè),利用相關(guān)數(shù)據(jù)去發(fā)現(xiàn),去解釋其原因,從中得到完善。其次是收集數(shù)據(jù)。有關(guān)數(shù)據(jù)的收集分為兩類:一類是可控?cái)?shù)據(jù),另一類是不可控?cái)?shù)據(jù)。采用不同的收集方法收集出來的結(jié)果也是不同的。因此,在收集過程中要知道數(shù)據(jù)收集是如何對其理論分布產(chǎn)生影響的,這樣才能在應(yīng)用中順利進(jìn)行。再次是數(shù)據(jù)的預(yù)處理。通過完成異常點(diǎn)的檢測和比例縮放、編碼和選擇特征等常見任務(wù),來對數(shù)據(jù)挖掘過程中諸多預(yù)處理活動進(jìn)行說明性例證。之后是對模型進(jìn)行評估。先建立一些新模型,并進(jìn)行評估選出最佳模型,數(shù)據(jù)挖掘技術(shù)利用該模型對數(shù)據(jù)進(jìn)行分析。最后解釋模型得出結(jié)論。通過對模型的解釋使數(shù)據(jù)挖掘所得出來的結(jié)果更加容易理解,簡單明了,為決策者提供決策支持。
2.數(shù)據(jù)挖掘與電子商務(wù)
2.1電子商務(wù)發(fā)展中存在的問題
大量網(wǎng)絡(luò)商品的涌現(xiàn),不論是買方或是賣方都會面臨著諸多問題。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為電子商務(wù)活動提供了強(qiáng)大的數(shù)據(jù)分析和技術(shù)支持。數(shù)據(jù)挖掘是面向應(yīng)用的,電子商務(wù)的發(fā)展使得越來越多的企業(yè)開始網(wǎng)上交易,電子商務(wù)后臺數(shù)據(jù)庫中客戶相關(guān)的數(shù)據(jù)和大量的交易記錄以及跟蹤用戶在Web上的瀏覽行為等數(shù)據(jù)資源中所蘊(yùn)含著大量的寶貴信息,有待于充分挖掘和利用。
2.2數(shù)據(jù)挖掘在電子商務(wù)應(yīng)用發(fā)展現(xiàn)狀
在電子商務(wù)活動中,采用數(shù)據(jù)挖掘技術(shù)在國內(nèi)尚屬于一個初步發(fā)展階段。雖然國內(nèi)在這一相關(guān)領(lǐng)域的研究也取得了很大的進(jìn)展,但仍存在一些不足之處:其一,實(shí)時性與推薦質(zhì)量不平衡。其二,電子商務(wù)推薦體系結(jié)構(gòu)不完善。其三,不能充分地對推薦結(jié)果進(jìn)行解釋。其四,不能全面關(guān)注訪問者,只是片面地對銷售商品進(jìn)行排比。國外利用數(shù)據(jù)挖掘技術(shù)來提高電子商務(wù)企業(yè)的經(jīng)營效益已取得顯著的成效。據(jù)亞馬遜前科學(xué)家GregLimlen介紹,亞馬遜至少有35%的銷售額來自于推薦系統(tǒng)。
2.3數(shù)據(jù)挖掘?qū)﹄娮由虅?wù)的影響
通過電子商務(wù)與數(shù)據(jù)挖掘技術(shù)進(jìn)行優(yōu)化配置,建立合理的電子商務(wù)推薦系統(tǒng),采用有效的組合推薦,將所有的推薦模型進(jìn)行統(tǒng)一管理,同時又能具體情況具體分析,從而對客戶提供精準(zhǔn)推薦,讓消費(fèi)者在較短的時間內(nèi)獲得較多的“有用”信息,這樣既能增加用戶黏性,又讓商家提升銷量。
3.基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)
3.1數(shù)據(jù)挖掘與推薦系統(tǒng)
推薦系統(tǒng)與數(shù)據(jù)挖掘在電子商務(wù)平臺中兩者相輔相成,聯(lián)系緊密^電子商務(wù)發(fā)展過程中積累了大量的商業(yè)數(shù)據(jù),這些數(shù)據(jù)蘊(yùn)含了大量的知識,需要數(shù)據(jù)挖掘技術(shù)進(jìn)行提取分析。而推薦系統(tǒng)根據(jù)數(shù)據(jù)挖掘得來的知識,對消費(fèi)者的興趣和需求進(jìn)行及時的分析,支持商業(yè)決策。
3.2電子商務(wù)推薦系統(tǒng)設(shè)計(jì)
按照系統(tǒng)論的觀點(diǎn),可將電子商務(wù)推薦系統(tǒng)分成四個組成部分:信息輸人、信息處理、模式發(fā)現(xiàn)與用戶反饋。首先,信息輸人主要來源于數(shù)據(jù)倉庫。其次,信息處理是基于各種不同的算法模型對數(shù)據(jù)倉庫里的數(shù)據(jù)進(jìn)行分析和處理,挖掘出潛在的規(guī)律或模式,即模式發(fā)現(xiàn)。最后,用戶客觀公正的反饋是評價推薦系統(tǒng)準(zhǔn)確性與可信性的主要依據(jù);跀(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)設(shè)計(jì)邏輯模型如圖丨所示。
4.結(jié)語
隨著網(wǎng)絡(luò)科技的步伐不斷加快,人們對電子商務(wù)的需求也不斷加大,收集大量的用戶數(shù)據(jù)進(jìn)行科學(xué)分析,挖掘客戶潛在需求,進(jìn)行個性化的推薦;跀(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)搭建起客戶與商家的橋梁,其必然推動電子商務(wù)的進(jìn)一步發(fā)展。
【數(shù)據(jù)挖掘技術(shù)的電子商務(wù)系統(tǒng)研究論文】相關(guān)文章:
Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用論文10-09
數(shù)據(jù)挖掘在電子商務(wù)的應(yīng)用論文10-09
數(shù)據(jù)挖掘在電子商務(wù)管理中的應(yīng)用論文10-09
云計(jì)算環(huán)境下數(shù)據(jù)挖掘技術(shù)分析論文10-09
淺談數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用經(jīng)濟(jì)論文10-10
復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)挖掘論文11-15
關(guān)于基于電子商務(wù)的CRM應(yīng)用系統(tǒng)研究論文10-09
Hadoop物聯(lián)網(wǎng)數(shù)據(jù)挖掘的算法分析論文10-10