亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: 數(shù)據(jù)挖掘的邏輯體系結(jié)構(gòu) [打印本頁(yè)]

作者: cu_Cbear    時(shí)間: 2011-03-08 13:23
標(biāo)題: 數(shù)據(jù)挖掘的邏輯體系結(jié)構(gòu)
數(shù)據(jù)挖掘的邏輯體系結(jié)構(gòu)




數(shù)據(jù)挖掘過程涉及多個(gè)組件的交互。您可以訪問 SQL Server 數(shù)據(jù)庫(kù)中的數(shù)據(jù)源或任何其他數(shù)據(jù)源,以便用于定型、測(cè)試或預(yù)測(cè)。使用 Business Intelligence Development Studio 或 Visual Studio 2005 可以定義數(shù)據(jù)挖掘結(jié)構(gòu)和模型。您可以通過使用 SQL Server Management Studio 來管理數(shù)據(jù)挖掘?qū)ο,并?chuàng)建預(yù)測(cè)和查詢。完成解決方案之后,您可以將其部署到 Analysis Services 實(shí)例。
  數(shù)據(jù)挖掘解決方案和項(xiàng)目
  若要?jiǎng)?chuàng)建數(shù)據(jù)挖掘項(xiàng)目,您必須定義數(shù)據(jù)源、數(shù)據(jù)挖掘結(jié)構(gòu)和數(shù)據(jù)挖掘模型。創(chuàng)建的數(shù)據(jù)挖掘項(xiàng)目還可以包含用于驗(yàn)證模型的測(cè)試集。將項(xiàng)目部署到服務(wù)器之后,您可以在初始解決方案中繼續(xù)開發(fā)和測(cè)試新模型。
  數(shù)據(jù)挖掘源數(shù)據(jù)
  您無需使用多維數(shù)據(jù)集或其他專用數(shù)據(jù)源即可執(zhí)行數(shù)據(jù)挖掘。對(duì)于關(guān)系數(shù)據(jù)表或已定義為 Analysis Services 數(shù)據(jù)源視圖的任何其他數(shù)據(jù)源,您可以快速方便地進(jìn)行數(shù)據(jù)挖掘。在數(shù)據(jù)挖掘中使用的數(shù)據(jù)并不會(huì)存儲(chǔ)在數(shù)據(jù)挖掘解決方案中,而僅存儲(chǔ)綁定。該數(shù)據(jù)可能駐留在 SQL Server 早期版本創(chuàng)建的數(shù)據(jù)庫(kù)、CRM 系統(tǒng),或者甚至平面文件中。使用 Analysis Services 數(shù)據(jù)源視圖,您可以通過指定多個(gè)表之間的聯(lián)接來組合各種數(shù)據(jù)源。您還可以添加具有多對(duì)一關(guān)系的表,以便創(chuàng)建嵌套表列。
  如果需要使用數(shù)據(jù)挖掘解決方案中的數(shù)據(jù),Analysis Services 將讀取源的數(shù)據(jù),并生成使用的聚合信息以及其他信息的緩存。您可以保留該緩存信息,并將其用于創(chuàng)建新的數(shù)據(jù)挖掘模型,或者您也可以刪除該緩存信息,以節(jié)省存儲(chǔ)空間。
  您可以使用新數(shù)據(jù)繼續(xù)更新您的數(shù)據(jù)挖掘解決方案,或者如果您認(rèn)為某一模型運(yùn)行良好,則可以按原樣部署該模型,并且從不向該模型添加新數(shù)據(jù)。
  SQL Server 2008 Analysis Services 還提供將數(shù)據(jù)分為定型數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的功能,這樣,您可以針對(duì)具有代表性的隨機(jī)選擇的數(shù)據(jù)集測(cè)試您的挖掘模型。
數(shù)據(jù)挖掘結(jié)構(gòu)
  “數(shù)據(jù)挖掘結(jié)構(gòu)”是一種邏輯數(shù)據(jù)結(jié)構(gòu),它定義據(jù)以生成挖掘模型的數(shù)據(jù)域。單個(gè)挖掘結(jié)構(gòu)可以支持多個(gè)共享同一個(gè)域的挖掘模型。通過將數(shù)據(jù)的百分比或數(shù)量指定為 HOLDOUT,數(shù)據(jù)挖掘結(jié)構(gòu)還可以分區(qū)為定型集和測(cè)試集。定義數(shù)據(jù)挖掘結(jié)構(gòu)時(shí)可自動(dòng)執(zhí)行該分區(qū)操作。
  數(shù)據(jù)挖掘模型
  “數(shù)據(jù)挖掘模型”是對(duì)數(shù)據(jù)、數(shù)據(jù)挖掘算法和影響所用數(shù)據(jù)以及數(shù)據(jù)處理方式的參數(shù)和篩選器設(shè)置集合進(jìn)行組合。您可以在 BI Development Studio 中使用數(shù)據(jù)挖掘擴(kuò)展插件 (DMX) 語(yǔ)言或數(shù)據(jù)挖掘向?qū)矶x數(shù)據(jù)挖掘模型。有關(guān)如何使用數(shù)據(jù)挖掘向?qū)У脑敿?xì)信息,請(qǐng)參閱數(shù)據(jù)挖掘向?qū)Вˋnalysis Services - 數(shù)據(jù)挖掘)。
  定義完挖掘模型的結(jié)構(gòu)之后,您需要對(duì)其進(jìn)行處理,并使用說明模型的模式來填充空結(jié)構(gòu)。這稱為“定型”模型。通過傳遞原始數(shù)據(jù),可以借助數(shù)學(xué)算法查找模式。您可以使用參數(shù)調(diào)整每種算法。
  
  生成新的數(shù)據(jù)挖掘模型時(shí),應(yīng)進(jìn)行預(yù)測(cè)以循環(huán)測(cè)試該模型,然后對(duì)該模型進(jìn)行相應(yīng)更改以改進(jìn)結(jié)果。這些更改可能包括添加更多數(shù)據(jù),或者更改模型的參數(shù)以使模型更符合數(shù)據(jù)。

   部署
  數(shù)據(jù)挖掘開發(fā)的最終目標(biāo)是創(chuàng)建最終用戶和分析人員進(jìn)行預(yù)測(cè)和執(zhí)行深入分析所使用的模型。因此,如果模型生成的結(jié)果滿足您的要求,請(qǐng)將該模型部署到生產(chǎn)環(huán)境中。在生產(chǎn)環(huán)境中,根據(jù)您的需求,挖掘模型可用于各種目的。下面的列表提供了一些可以使用數(shù)據(jù)挖掘模型執(zhí)行的任務(wù)示例:
  使用模型創(chuàng)建預(yù)測(cè),然后可以使用這些預(yù)測(cè)作出業(yè)務(wù)決策。SQL Server 提供可用于創(chuàng)建預(yù)測(cè)查詢的 DMX 語(yǔ)言,同時(shí)還提供有助于生成查詢的預(yù)測(cè)查詢生成器。
  直接將數(shù)據(jù)挖掘功能嵌入到應(yīng)用程序。您可以包括分析管理對(duì)象 (AMO) 或一個(gè)包含一組對(duì)象(應(yīng)用程序可使用這組對(duì)象創(chuàng)建、更改、處理以及刪除挖掘結(jié)構(gòu)和挖掘模型)的程序集。另外,可以直接將 XML for Analysis (XMLA) 消息發(fā)送到 Analysis Services 實(shí)例。
  使用 Integration Services 創(chuàng)建一個(gè)包,在這個(gè)包中,挖掘模型用于自動(dòng)將傳入數(shù)據(jù)分離到多個(gè)表中。例如,如果數(shù)據(jù)庫(kù)不斷地通過潛在客戶進(jìn)行更新,則可以結(jié)合使用挖掘模型和 Integration Services 將傳入數(shù)據(jù)拆分為可能購(gòu)買產(chǎn)品的客戶和不可能購(gòu)買產(chǎn)品的客戶。
  創(chuàng)建可讓用戶直接對(duì)現(xiàn)有挖掘模型進(jìn)行查詢的報(bào)表。用戶可能希望創(chuàng)建不同的預(yù)測(cè),或者分析人員可能希望直接訪問挖掘模型內(nèi)容,以瀏覽數(shù)據(jù)中的相關(guān)模式。
  更新模型是部署策略的一部分。隨著組織傳入的數(shù)據(jù)不斷增多,必須重新處理模型,以便提高效用。




歡迎光臨 Chinaunix (http://72891.cn/) Powered by Discuz! X3.2