亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3131 | 回復(fù): 0
打印 上一主題 下一主題

BIG DATA 大數(shù)據(jù)時代來臨 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2012-09-27 09:57 |只看該作者 |倒序瀏覽
本帖最后由 turingbooks 于 2012-09-27 09:58 編輯

“大數(shù)據(jù)時代”已經(jīng)來臨,并對很多領(lǐng)域都產(chǎn)生了深遠(yuǎn)的影響。在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺;而在公共衛(wèi)生、經(jīng)濟(jì)發(fā)展和經(jīng)濟(jì)預(yù)測等領(lǐng)域中,“大數(shù)據(jù)”的預(yù)見能力也已經(jīng)嶄露頭角。

數(shù)據(jù)聚類找出霍亂病因

一種重要的數(shù)據(jù)匯總形式是聚類,在聚類中,數(shù)據(jù)被看成是多維空間下的點,空間中相互鄰近的點將被賦予相同的類別。這些類別本身也會被概括表示,比如通過類別質(zhì)心及類別中的點到質(zhì)心的平均距離來描述。這些類別的概括信息綜合在一起形成了全體數(shù)據(jù)集合的數(shù)據(jù)匯總結(jié)果。

一個利用聚類來解決問題的著名實例發(fā)生在很久以前的倫敦,在整個問題的解決中并沒有使用計算機(jī) 。內(nèi)科醫(yī)生John Snow在處理霍亂爆發(fā)時在城市地圖上標(biāo)出了病例的發(fā)生地點。圖1-1給出了該圖的一個小片段,展示了病例的傳播情況。



圖1-1 在倫敦市地圖上標(biāo)出的霍亂病例的傳播情況示意圖

圖中顯示,病例聚集在某些交叉路口。這些路口的水井已經(jīng)被污染,離這些水井最近的居民染上了疾病,而清潔的水井附近的居民則沒有染病。如果沒對這些數(shù)據(jù)進(jìn)行聚類,霍亂的病因就難以揭開。

——摘自《大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理》



書中分析了海量數(shù)據(jù)集數(shù)據(jù)挖掘常用的算法,介紹了目前Web應(yīng)用的許多重要話題。主要內(nèi)容包括:

分布式文件系統(tǒng)以及Map-Reduce工具;
相似性搜索;
數(shù)據(jù)流處理以及針對易丟失數(shù)據(jù)等特殊情況的專用處理算法;
搜索引擎技術(shù),如谷歌的PageRank;
頻繁項集挖掘;
大規(guī)模高維數(shù)據(jù)集的聚類算法;
Web應(yīng)用中的關(guān)鍵問題:廣告管理和推薦系統(tǒng)。


作者簡介

Anand Rajaraman 數(shù)據(jù)庫和Web技術(shù)領(lǐng)域權(quán)威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學(xué)計算機(jī)科學(xué)系助理教授。Rajaraman職業(yè)生涯非常成功:1996年創(chuàng)辦Junglee公司,兩年后該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬遜技術(shù)總監(jiān),推動亞馬遜從一個零售商轉(zhuǎn)型為零售平臺;2000年與人合創(chuàng)Cambrian,孵化出幾個后來被谷歌收購的公司;2005年創(chuàng)辦Kosmix公司并任CEO,該公司2011年被沃爾瑪集團(tuán)收購。Rajaraman生于印度,在斯坦福大學(xué)獲得計算機(jī)科學(xué)碩士和博士學(xué)位。求學(xué)期間與人合著的一篇論文榮列近20年來被引用次數(shù)最多的論文之一。博客地址http://anand.typepad.com/datawocky/。

Jeffrey David Ullman 美國國家工程院院士,計算機(jī)科學(xué)家,斯坦福大學(xué)教授。Ullman早年在貝爾實驗室工作,之后任教于普林斯頓大學(xué),十年后加入斯坦福大學(xué)直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻(xiàn)獎、Knuth獎等多項科研大獎;他是“龍書”《編譯原理》、數(shù)據(jù)庫領(lǐng)域權(quán)威指南《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》的合著者;麾下多名學(xué)生成為了數(shù)據(jù)庫領(lǐng)域的專家,其中最有名的當(dāng)屬谷歌創(chuàng)始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP