數(shù)據(jù)挖掘過程涉及多個(gè)組件的交互。您可以訪問 SQL Server 數(shù)據(jù)庫(kù)中的數(shù)據(jù)源或任何其他數(shù)據(jù)源,以便用于定型、測(cè)試或預(yù)測(cè)。使用 Business Intelligence Development Studio 或 Visual Studio 2005 可以定義數(shù)據(jù)挖掘結(jié)構(gòu)和模型。您可以通過使用 SQL Server Management Studio 來管理數(shù)據(jù)挖掘?qū)ο,并?chuàng)建預(yù)測(cè)和查詢。完成解決方案之后,您可以將其部署到 Analysis Services 實(shí)例。 數(shù)據(jù)挖掘解決方案和項(xiàng)目
若要?jiǎng)?chuàng)建數(shù)據(jù)挖掘項(xiàng)目,您必須定義數(shù)據(jù)源、數(shù)據(jù)挖掘結(jié)構(gòu)和數(shù)據(jù)挖掘模型。創(chuàng)建的數(shù)據(jù)挖掘項(xiàng)目還可以包含用于驗(yàn)證模型的測(cè)試集。將項(xiàng)目部署到服務(wù)器之后,您可以在初始解決方案中繼續(xù)開發(fā)和測(cè)試新模型。 數(shù)據(jù)挖掘源數(shù)據(jù)
您無需使用多維數(shù)據(jù)集或其他專用數(shù)據(jù)源即可執(zhí)行數(shù)據(jù)挖掘。對(duì)于關(guān)系數(shù)據(jù)表或已定義為 Analysis Services 數(shù)據(jù)源視圖的任何其他數(shù)據(jù)源,您可以快速方便地進(jìn)行數(shù)據(jù)挖掘。在數(shù)據(jù)挖掘中使用的數(shù)據(jù)并不會(huì)存儲(chǔ)在數(shù)據(jù)挖掘解決方案中,而僅存儲(chǔ)綁定。該數(shù)據(jù)可能駐留在 SQL Server 早期版本創(chuàng)建的數(shù)據(jù)庫(kù)、CRM 系統(tǒng),或者甚至平面文件中。使用 Analysis Services 數(shù)據(jù)源視圖,您可以通過指定多個(gè)表之間的聯(lián)接來組合各種數(shù)據(jù)源。您還可以添加具有多對(duì)一關(guān)系的表,以便創(chuàng)建嵌套表列。
如果需要使用數(shù)據(jù)挖掘解決方案中的數(shù)據(jù),Analysis Services 將讀取源的數(shù)據(jù),并生成使用的聚合信息以及其他信息的緩存。您可以保留該緩存信息,并將其用于創(chuàng)建新的數(shù)據(jù)挖掘模型,或者您也可以刪除該緩存信息,以節(jié)省存儲(chǔ)空間。
您可以使用新數(shù)據(jù)繼續(xù)更新您的數(shù)據(jù)挖掘解決方案,或者如果您認(rèn)為某一模型運(yùn)行良好,則可以按原樣部署該模型,并且從不向該模型添加新數(shù)據(jù)。
SQL Server 2008 Analysis Services 還提供將數(shù)據(jù)分為定型數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的功能,這樣,您可以針對(duì)具有代表性的隨機(jī)選擇的數(shù)據(jù)集測(cè)試您的挖掘模型。 數(shù)據(jù)挖掘結(jié)構(gòu)
“數(shù)據(jù)挖掘結(jié)構(gòu)”是一種邏輯數(shù)據(jù)結(jié)構(gòu),它定義據(jù)以生成挖掘模型的數(shù)據(jù)域。單個(gè)挖掘結(jié)構(gòu)可以支持多個(gè)共享同一個(gè)域的挖掘模型。通過將數(shù)據(jù)的百分比或數(shù)量指定為 HOLDOUT,數(shù)據(jù)挖掘結(jié)構(gòu)還可以分區(qū)為定型集和測(cè)試集。定義數(shù)據(jù)挖掘結(jié)構(gòu)時(shí)可自動(dòng)執(zhí)行該分區(qū)操作。
數(shù)據(jù)挖掘模型
“數(shù)據(jù)挖掘模型”是對(duì)數(shù)據(jù)、數(shù)據(jù)挖掘算法和影響所用數(shù)據(jù)以及數(shù)據(jù)處理方式的參數(shù)和篩選器設(shè)置集合進(jìn)行組合。您可以在 BI Development Studio 中使用數(shù)據(jù)挖掘擴(kuò)展插件 (DMX) 語(yǔ)言或數(shù)據(jù)挖掘向?qū)矶x數(shù)據(jù)挖掘模型。有關(guān)如何使用數(shù)據(jù)挖掘向?qū)У脑敿?xì)信息,請(qǐng)參閱數(shù)據(jù)挖掘向?qū)Вˋnalysis Services - 數(shù)據(jù)挖掘)。
定義完挖掘模型的結(jié)構(gòu)之后,您需要對(duì)其進(jìn)行處理,并使用說明模型的模式來填充空結(jié)構(gòu)。這稱為“定型”模型。通過傳遞原始數(shù)據(jù),可以借助數(shù)學(xué)算法查找模式。您可以使用參數(shù)調(diào)整每種算法。