Watson 的強(qiáng)大功能
IBM Power Systems 產(chǎn)品市場營銷經(jīng)理 Ian Jaman 在會議上發(fā)表了講話,分享了他與 IBM 研究科學(xué)家一起推廣 Power Systems 技術(shù)(參加 “Jeopardy!” 智力問答節(jié)目)的經(jīng)歷。他介紹了 Watson 的背景,以及它為什么要留在一個 IBM 設(shè)備中,而不是到 “Jeopardy!” 節(jié)目的現(xiàn)場。與會者發(fā)現(xiàn)了一個重要的細(xì)節(jié),這說明 IBM 不打算隱瞞什么:把 Watson 全部搬到現(xiàn)場是不可能的。Watson 由 10 個機(jī)架的 POWER7 750 組成;90 個 Power 750 服務(wù)器占據(jù) 9 個機(jī)架,網(wǎng)絡(luò)和存儲設(shè)備占據(jù)第 10 個機(jī)架。一共有 2,880 個 POWER7 核。
Watson 在 Linux 而不是 AIX 上運(yùn)行的部分原因是,它最初是在 x86 上建模的。值得注意的是,它在 x86 上使用的服務(wù)器數(shù)量比在 Power 上多 4 倍。對于關(guān)注服務(wù)器整合的人而言,很容易看出基于 POWER 處理器的技術(shù)進(jìn)行服務(wù)器整合的效果。
誰能與之匹敵?
IBM 為什么選擇在 “Jeopardy!” 節(jié)目中讓 Watson 出場。除了這個節(jié)目非常吸引人之外,這個比賽具有以下優(yōu)點(diǎn),這讓人與計算機(jī)進(jìn)行公平的對抗,有助于 IBM 展示技術(shù):
- 涉及廣泛的主題,包括歷史、文學(xué)、政治、藝術(shù)和科學(xué)
- 要求快速反應(yīng)、準(zhǔn)確性和信心
- 涉及文字游戲、微妙的含義、反話和謎語
IBM 做過類似的事情。1997 年,IBM 通過一場人與計算機(jī)之間的國際象棋比賽展示了 “深藍(lán)” 超級計算機(jī)的能力。盡管 “深藍(lán)” 獲勝了,但是它不像 Watson 這么復(fù)雜。“深藍(lán)” 比較簡單,那是因?yàn)閲H象棋的走法和狀態(tài)數(shù)量是有限的,而且有明確的數(shù)學(xué)規(guī)則。
Watson 參加 “Jeopardy!” 節(jié)目比下國際象棋要復(fù)雜得多。主要原因之一是問題的上下文是含糊的。因?yàn)榭梢杂脽o限多的方式表述相同的含義,這要求計算機(jī)具有人的理解力。這也是 IBM 面對的主要風(fēng)險:他們不知道 Watson 是否會獲勝。
會議上討論了復(fù)雜性的一些其他因素(表述為復(fù)雜性的 5 個方面):
- 廣泛/開放的數(shù)據(jù)領(lǐng)域
- 復(fù)雜的語言
- 高精度
- 對準(zhǔn)確性的信心
- 高速度
Watson 必須分析問題和主題,生成假設(shè),對假設(shè)和證據(jù)進(jìn)行評估,形成最終答案并評分,充滿自信地回答。
Watson 背后的技術(shù)
Watson 背后的技術(shù)包括 IBM DeepQA、Apache UIMA 和 Apache Hadoop。DeepQA 用于開發(fā)和支持文本和多模分析應(yīng)用程序的水平擴(kuò)展。它還幫助分析文本和生成關(guān)于文本的注解或斷言。Apache UIMA(Unstructured Information Management Architecture)可以水平擴(kuò)展異步消息傳遞。它用于跨所有基于 POWER7 處理器的核進(jìn)行水平擴(kuò)展。它還管理所有進(jìn)程間通信。Apache Hadoop 是一種開放源碼軟件,Watson 使用它分布處理非結(jié)構(gòu)化信息的工作負(fù)載。
最終得分
“Jeapordy!” 節(jié)目的記錄保持者是 Ken Jennings。這位最優(yōu)秀的 “Jeapordy!” 獲勝者的記錄是回答了 80% 的問題,正確率為 80%。盡管 Watson 面對強(qiáng)大的對手,但是它很有信心。在 2010 年與前冠軍的 55 次實(shí)時比賽中,Watson 的勝率達(dá)到了 71%。
第一回合之后,Watson 取得了超過 $30,000 的明顯領(lǐng)先,最終以總金額 $77,973 贏得比賽。當(dāng)然,Watson 并不完美,有時候甚至讓人發(fā)笑。有一次,Watson 和大家一樣給出了錯誤的回答。
Watson 背后的技術(shù)會對人類有哪些貢獻(xiàn)?公認(rèn)的看法是它最適合應(yīng)用于醫(yī)療保健和生命科學(xué)領(lǐng)域,尤其是輔助診斷、基于癥狀的分析、配合用藥以及向醫(yī)生提供研究結(jié)果和信息。在醫(yī)療保健方面,我們討論了數(shù)據(jù)到知識的轉(zhuǎn)化。這確實(shí)是 Watson 能夠做到的事情之一。
這些技術(shù)應(yīng)該能夠提供幫助的其他領(lǐng)域包括技術(shù)支持服務(wù)臺、企業(yè)知識管理、業(yè)務(wù)智能化和政府的市民服務(wù)。
POWER7 新聞和趨勢
在 Power 方面,會議上討論的最大新聞是在新的 Power 775 上取得的成果。這個新機(jī)型首次采用了一種新的水冷技術(shù),具有 256 個核(使用 8 個 POWER7 芯片),這讓它與最高端的 Power 795 不相上下,但是資源消耗更少。還討論了對于 POWER8 處理器已經(jīng)完成的工作。這個研究項目本身要再過 12-18 個月才能成熟,所以不要指望很快看到成果。
在我們的用戶組會議上了解到 Watson 的情況確實(shí)讓人很興奮,這讓 NYC 地區(qū)的用戶進(jìn)一步體會到了 POWER 的強(qiáng)大功能。如果您有興趣在自己的地區(qū)建立用戶組,請與 Linda Grigoleit 聯(lián)系 (
lfg@us.ibm.com)。她在 IBM 市場營銷部門的主要職責(zé)是協(xié)調(diào)全世界的所有用戶組活動。
關(guān)于作者
Ken Milberg 是 PMP,同時也是 techtarget.com 的撰稿人/站點(diǎn)專家,他還為 searchopensource.com 提供 Linux 技術(shù)信息和支持。Ken 是 IBM Systems Magazine,Open Edition 的撰稿人和技術(shù)編輯。Ken 擁有 University of Maryland University College 的計算機(jī)與信息科學(xué)學(xué)士學(xué)位和技術(shù)管理科學(xué)碩士學(xué)位。他是 Long Island POWER-AIX 用戶組的創(chuàng)始人和負(fù)責(zé)人。這些年以來,他在各種規(guī)模的企業(yè)工作過,并且擔(dān)任過各種職位,包括 CIO 和高級 AIX 工程師。他現(xiàn)在在 Future Tech 工作,這是一家總部設(shè)在長島的 IBM 業(yè)務(wù)合作伙伴。Ken 不僅是已通過 PMI 認(rèn)證的項目管理專業(yè)人員(PMP),還是通過 IBM 認(rèn)證的高級技術(shù)專家(CATE,IBM System p5 2006)。
http://www.ibm.com/developerworks/cn/aix/systemmaga/7/perfect_together/index.html