亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
最近訪問(wèn)板塊 發(fā)新帖
查看: 185740 | 回復(fù): 9
打印 上一主題 下一主題

【有獎(jiǎng)討論】實(shí)戰(zhàn)分享篇:從技術(shù)角度談機(jī)器學(xué)習(xí)入門(獲獎(jiǎng)名單公布!) [復(fù)制鏈接]

論壇徽章:
146
2015年亞洲杯之日本
日期:2015-04-28 13:32:012015年亞洲杯之朝鮮
日期:2015-05-06 10:16:442015年亞洲杯之日本
日期:2015-05-06 10:21:342015年亞洲杯紀(jì)念徽章
日期:2015-05-13 17:16:442015亞冠之北京國(guó)安
日期:2015-05-13 17:18:292015亞冠之鹿島鹿角
日期:2015-05-13 17:19:062015亞冠之德黑蘭石油
日期:2015-05-27 16:47:402015亞冠之塔什干棉農(nóng)
日期:2015-05-28 15:24:122015亞冠之卡爾希納薩夫
日期:2015-06-01 13:52:392015亞冠之柏斯波利斯
日期:2015-06-04 17:37:292015亞冠之阿爾納斯?fàn)?日期:2015-06-16 11:31:202015亞冠之塔什干火車頭
日期:2015-06-23 10:12:33
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2018-05-30 13:50 |只看該作者 |倒序?yàn)g覽
本次活動(dòng)獲得《scikit-learn機(jī)器學(xué)習(xí):常用算法原理及編程實(shí)戰(zhàn)》獎(jiǎng)勵(lì)的用戶是:
@renxiao2003
@shang2010
@aloki

@jieforest

@nail78

請(qǐng)以上5位用戶,請(qǐng)于8月4日前以站內(nèi)的形式聯(lián)系管理員王楠w_n,如無(wú)法發(fā)站內(nèi)請(qǐng)加QQ 2504593583


話題背景:
在學(xué)習(xí)機(jī)器學(xué)習(xí)之初,你可能會(huì)被被一大堆數(shù)學(xué)公式和推導(dǎo)過(guò)程所折磨,但實(shí)際上,在機(jī)器學(xué)習(xí)的從業(yè)人員里,究竟有多少人需要從頭去實(shí)現(xiàn)一個(gè)算法?又有多少人有機(jī)會(huì)去發(fā)明一個(gè)新算法?所以,今天社區(qū)特開一個(gè)技術(shù)帖,我們就以下一些日常學(xué)習(xí)遭遇的問(wèn)題,做一個(gè)概括和討論。

討論問(wèn)題:

1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?
2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)質(zhì)何在?


活動(dòng)時(shí)間:2018年5月30日-6月25日


活動(dòng)獎(jiǎng)勵(lì):
活動(dòng)結(jié)束后,會(huì)選取5位討論精彩的同學(xué),送《scikit-learn機(jī)器學(xué)習(xí):常用算法原理及編程實(shí)戰(zhàn)》一本。

作者: 黃永昌   
出版社:機(jī)械工業(yè)出版社
ISBN:9787111590248
上架時(shí)間:2018-2-7
出版日期:2018 年3月
開本:16開
版次:1-1
所屬分類:計(jì)算機(jī) > 人工智能 > 綜合

購(gòu)買鏈接:https://item.jd.com/12316506.html

內(nèi)容簡(jiǎn)介:本書共分為11章,介紹了在Python環(huán)境下學(xué)習(xí)scikit-learn機(jī)器學(xué)習(xí)框架的相關(guān)知識(shí),涵蓋的主要內(nèi)容有機(jī)器學(xué)習(xí)概述、Python機(jī)器學(xué)習(xí)軟件包、機(jī)器學(xué)習(xí)理論基礎(chǔ)、k-近鄰算法、線性回歸算法、邏輯回歸算法、決策樹、支持向量機(jī)、樸素貝葉斯算法、PCA算法和k-均值算法等。本書適合有一定編程基礎(chǔ)的讀者閱讀,尤其適合想從事機(jī)器學(xué)習(xí)、人工智能、深度學(xué)習(xí)及機(jī)器人相關(guān)技術(shù)的程序員和愛好者閱讀。另外,相關(guān)院校和培訓(xùn)機(jī)構(gòu)也可以將本書作為教材使用。

樣張?jiān)囎x:
scikit-learn機(jī)器學(xué)習(xí):常用算法原理及編程實(shí)戰(zhàn)文前-03.pdf (4.78 MB, 下載次數(shù): 90)

論壇徽章:
59
2015七夕節(jié)徽章
日期:2015-08-24 11:17:25ChinaUnix專家徽章
日期:2015-07-20 09:19:30每周論壇發(fā)貼之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38榮譽(yù)版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年紀(jì)念徽章
日期:2015-07-20 11:05:27IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-07-20 11:05:34操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:36程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:40數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:432015年辭舊歲徽章
日期:2015-07-20 11:05:44
2 [報(bào)告]
發(fā)表于 2018-05-31 15:45 |只看該作者
本帖最后由 renxiao2003 于 2018-06-03 22:16 編輯

沙發(fā)先坐上。
1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?(以下內(nèi)容來(lái)看成CSDN,確實(shí)總結(jié)的不錯(cuò)。)
研究數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)有一段時(shí)間了,對(duì)數(shù)據(jù)挖掘來(lái)說(shuō),商用軟件有SAS、 Clementine、Oracle數(shù)據(jù)挖掘組件等等;由于個(gè)人學(xué)習(xí)和版權(quán)、算法定制等問(wèn)題,開源的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)軟件(庫(kù))目前也十分必需,現(xiàn)在就跟大家介紹下比較流行和常用的機(jī)器學(xué)習(xí)開源庫(kù)。

  以前在學(xué)校用過(guò)matlab,說(shuō)實(shí)話真方便,通常一個(gè)模型只要幾十行甚至十幾行代碼就能搞定,但是正版matlab較貴,而且不太適合商業(yè)開發(fā)使用,所以工業(yè)界使用它的并不多(通信行業(yè)、研究所比較普遍);相應(yīng)地,在工業(yè)界機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的實(shí)驗(yàn)語(yǔ)言多為java、python,因?yàn)?python與C\C++具有先天的血緣,所以python更容易擴(kuò)展;java的機(jī)器學(xué)習(xí)庫(kù)也十分流行,主要體現(xiàn)在大數(shù)據(jù)下的jvm的本質(zhì)和算法并行化的優(yōu)勢(shì);現(xiàn)推薦給大家以下學(xué)習(xí)庫(kù):

1.機(jī)器學(xué)習(xí)開源軟件網(wǎng)(收錄了各種機(jī)器學(xué)習(xí)的各種編程語(yǔ)言學(xué)術(shù)與商業(yè)的開源軟件)
http://mloss.org

2 偶爾找到的機(jī)器學(xué)習(xí)資源網(wǎng):(也非常全,1和2基本收錄了所有ML的經(jīng)典開源軟件了)
http://www.dmoz.org/Computers/Artificial_Intelligence/Machine_Learning/Software/

3 libsvm (支持向量機(jī)界最牛的,不用多說(shuō)了,臺(tái)灣大學(xué)的林教授的杰作)
http://www.csie.ntu.edu.tw/~cjlin/libsvm/

4 WEKA (基于java的機(jī)器學(xué)習(xí)算法最全面最易用的開源軟件)
http://www.cs.waikato.ac.nz/ml/weka/

5 scikit (本人最喜歡的一個(gè)基于python的機(jī)器學(xué)習(xí)軟件,代碼寫得非常好,而且官方的文檔非常全,所有都有例子,算法也齊全,開發(fā)也活躍
,強(qiáng)烈推薦給大家用)
https://pypi.python.org/pypi/scikit-learn/

6 OpenCv(最牛的開源計(jì)算機(jī)視覺(jué)庫(kù)了,前途無(wú)可限量,做圖像處理與模式識(shí)別的一定要用,總不能整天抱著matlab做實(shí)驗(yàn)和工業(yè)界脫節(jié)吧,但是有一定難度)
http://opencv.willowgarage.com/wiki/

7 Orange (基于c++和python接口的機(jī)器學(xué)習(xí)軟件,界面漂亮,調(diào)用方便,可以同時(shí)學(xué)習(xí)C++和python,還有可視化的功能,)
http://orange.biolab.si/

8 Mallet (基于JAVA實(shí)現(xiàn)的機(jī)器學(xué)習(xí)庫(kù),主要用于自然語(yǔ)言處理方面,特色是馬爾可夫模型和隨機(jī)域做得好,可和WEKA互補(bǔ))
http://mallet.cs.umass.edu/

9 NLTK(PYTHON的自然處理開源庫(kù),非常易用,也強(qiáng)大,還有幾本orelly的經(jīng)典教程)
http://nltk.org/

10 lucene(基于java的包括nutch,solr,hadoop,mahout等全套,是做信息檢索和搜索引擎的同志們必學(xué)的開源軟件了,學(xué)JAVA的必學(xué))
http://lucene.apache.org/

Additional:
1.pyml(a python module for machine learning,支持svm/knn/k-means==)
http://mlpy.sourceforge.net/

2.mahout(阿帕奇基金下項(xiàng)目,其主要是可以與hadoop進(jìn)行天然結(jié)合,從而并行運(yùn)行,在魯棒性方面很好)
http://mahout.apache.org/

3.milk(python的機(jī)器學(xué)習(xí)工具包,主要是針對(duì)監(jiān)督學(xué)習(xí),包括svm/knn/決策樹)
http://pypi.python.org/pypi/milk/

4.Octave(Andrew NG課上推薦使用的,類似matlab)
http://www.gnu.org/software/octave/
2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
我沒(méi)有做這個(gè),但我們部門確實(shí)有做機(jī)器學(xué)習(xí)的。使用的是tensorflow,我們的小隊(duì)友天天研究這個(gè)。書也好幾本。用的是Python語(yǔ)言。不過(guò)我是做純軟件開發(fā)的,不太了解這方面的知識(shí)。
3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)質(zhì)何在?(以下內(nèi)容來(lái)自CSDN)

Scikit-Learn是用Python開發(fā)的機(jī)器學(xué)習(xí)庫(kù),其中包含大量機(jī)器學(xué)習(xí)算法、數(shù)據(jù)集,是數(shù)據(jù)挖掘方便的工具。

Scikit-Learn的安裝可使用pip工具,在安裝前需要安裝NumPy和SciPy,打開一個(gè)命令行中端并輸入:

$pip install -U scikit-learn

基本操作:

1.數(shù)據(jù)加載:

對(duì)于csv文件,pandas庫(kù)提供的pandas.read_csv能夠快速的加載并根據(jù)提供的參數(shù)可進(jìn)行數(shù)據(jù)的處理,生成DataFrame:

import pandas as pd

df=pd.read_csv('data.csv')

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html(pandas api)


對(duì)于具有一定格式的文本文件或二進(jìn)制文件,可使用NumPy進(jìn)行數(shù)據(jù)加載:

import numpy as np

data_file='dataset.txt'

X=np.load_txt(data_file)


對(duì)于其他格式的文件,可以自由處理并加載到二維數(shù)組中,最終可生成DataFrame

2.數(shù)據(jù)處理:

在將數(shù)據(jù)加載到DataFrame中后可方便地對(duì)數(shù)據(jù)進(jìn)行處理,也可以方便地進(jìn)行特征選擇與提取

import pandas as pd

df = pd.read_csv('data.csv')

df.columns = ['id','name','time']#設(shè)置數(shù)據(jù)的特征名

df.set_index('id')#設(shè)置索引

df['age'] = 0 #添加新的屬性age,并全部賦值為0

for i,row in df.iterrows(): #逐行遍歷dataframe

#body of for

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html(DataFrame Api)


3.一個(gè)分類的例子:

用決策樹預(yù)測(cè)獲勝球隊(duì)(來(lái)自《Learning Data Mining With Python》)

采集數(shù)據(jù):http://www.basketball-reference.com/leagues/NBA_2014_games.html提供了2013-2014的比賽勝負(fù)數(shù)據(jù),不過(guò)已經(jīng)無(wú)法一鍵導(dǎo)出csv了,需要一個(gè)月份一個(gè)月份地進(jìn)行csv的復(fù)制

樣例數(shù)據(jù)如下:


將所有數(shù)據(jù)保存到文本文件并另存為CSV文件以便后面的使用。

接下來(lái)就是加載我們的CSV文件:data.csv

import numpy as np

import pandas as pd

dataset = pd.read_csv('data.csv') #注意文件在自己電腦中的路徑

print dataset.ix[:5] #查看前5行數(shù)據(jù)

數(shù)據(jù)處理:

read_csv函數(shù)有一定的數(shù)據(jù)處理能力,所以我們修改一下剛剛的代碼

dataset = pd.read_csv('data.csv',parse_dates=["Date"],skiprows=[0,]) #將'Date'屬性轉(zhuǎn)換為了標(biāo)準(zhǔn)日期類型,省略了第一行

dataset.columns = ["Date","Score_Type","Visitor Team","VisitorPts","Home Team","HomePts","OT?","Notes"]


提取新的特征:

dataset['HomeWin'] = dataset["VisitorPts"] < dataset["HomePts"]

y_true = dataset['HomeWin'].values #提取出一列數(shù)據(jù)

                #創(chuàng)建字典存儲(chǔ)球隊(duì)上次比賽的結(jié)果

from collections import defaultdict

won_last = defaultdict(int)

for index,row in dataset.iterrows():

home_team = row["Home Team"]

visitor_team = row["Visitor Team"]

row["HomeLastWin"] = won_last[home_team]

row["VisitorLastWin"] = won_last[visitor_team]

dataset.ix[index] = row

win_last[home_team] = row["HomeWin"]

win_last[visitor_team] = not row["HomeWin"]

使用決策樹:

from sklearn.trree import DecisionTreeClassifier

clf = DecisionTreeClassifier(random_state=14)

X_previouswins = dataset[["HomeLastWin","VisitorLastWin"]].values

scores = cross_val_score(clf,X_previouswins ,y_true,scoring='accuracy')

看了看似乎所有的機(jī)器學(xué)習(xí)庫(kù)都是Python的。有空我要抓緊學(xué)習(xí)一下Python了。


論壇徽章:
59
2015七夕節(jié)徽章
日期:2015-08-24 11:17:25ChinaUnix專家徽章
日期:2015-07-20 09:19:30每周論壇發(fā)貼之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38榮譽(yù)版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年紀(jì)念徽章
日期:2015-07-20 11:05:27IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-07-20 11:05:34操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:36程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:40數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:432015年辭舊歲徽章
日期:2015-07-20 11:05:44
3 [報(bào)告]
發(fā)表于 2018-05-31 15:45 |只看該作者
沙發(fā)先坐上。

論壇徽章:
154
2022北京冬奧會(huì)紀(jì)念版徽章
日期:2015-08-07 17:10:5720周年集字徽章-年
日期:2022-10-26 16:44:2015-16賽季CBA聯(lián)賽之深圳
日期:2022-11-02 14:02:4515-16賽季CBA聯(lián)賽之八一
日期:2022-11-28 12:07:4820周年集字徽章-20	
日期:2023-07-19 08:49:4515-16賽季CBA聯(lián)賽之八一
日期:2023-11-04 19:23:5115-16賽季CBA聯(lián)賽之廣夏
日期:2023-12-13 18:09:34
4 [報(bào)告]
發(fā)表于 2018-05-31 23:09 |只看該作者
本帖最后由 shang2010 于 2018-05-31 23:18 編輯

沙發(fā)先坐上。


小康小康,今天天氣怎樣,我想聽音樂(lè)夢(mèng)里水鄉(xiāng)

論壇徽章:
154
2022北京冬奧會(huì)紀(jì)念版徽章
日期:2015-08-07 17:10:5720周年集字徽章-年
日期:2022-10-26 16:44:2015-16賽季CBA聯(lián)賽之深圳
日期:2022-11-02 14:02:4515-16賽季CBA聯(lián)賽之八一
日期:2022-11-28 12:07:4820周年集字徽章-20	
日期:2023-07-19 08:49:4515-16賽季CBA聯(lián)賽之八一
日期:2023-11-04 19:23:5115-16賽季CBA聯(lián)賽之廣夏
日期:2023-12-13 18:09:34
5 [報(bào)告]
發(fā)表于 2018-05-31 23:48 |只看該作者
1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?
OpenAI
有人擔(dān)心機(jī)器學(xué)習(xí)的軍備競(jìng)賽會(huì)使世界上的頂尖大學(xué)失去AI人才,因?yàn)榧夹g(shù)的巨大飛躍會(huì)打上某個(gè)公司的專有標(biāo)簽。所以,Elon Musk和他的朋友為OpenAI投資了超過(guò)10億美元,而這是一個(gè)非盈利的AI研究計(jì)劃。
OpenAI的使命是建立安全的人工智能(AGI),確保AGI優(yōu)勢(shì)盡可能廣泛和均勻地分布。我們期望AI技術(shù)在短期內(nèi)會(huì)有巨大的影響,且影響力將超過(guò)第一代AGI的影響力;
OpenAI擁有超過(guò)60名全職研究人員,發(fā)表了數(shù)篇有關(guān)AI和開源軟件工具進(jìn)展的論文。

TensorFlow
這是谷歌開源的機(jī)器學(xué)習(xí)庫(kù),它在整個(gè)機(jī)器學(xué)習(xí)領(lǐng)域目前地位還是排在首位。TensorFlow主要使用Python編寫,其中也有一些Java和Go的實(shí)驗(yàn)API。
TensorFlow的入門課程有兩個(gè)部分組成,一個(gè)是初學(xué)者部分,還有一個(gè)是ML專家部分。TensorFlow估計(jì)是本文推薦的開源工具中最易于訪問(wèn)的。而且它也是GitHub上最頂級(jí)的開源機(jī)器學(xué)習(xí)工具,擁有很多項(xiàng)目以及龐大的社區(qū)。

char-rnn
這個(gè)基于Torch/Lua的神經(jīng)網(wǎng)絡(luò)能夠被推薦,完全是因?yàn)镴anelle Shane的工作。來(lái)自the Frontier of Science的研究員McShane已經(jīng)提出了一些令人驚奇的有趣的項(xiàng)目,且與字符級(jí)語(yǔ)言模型息息相關(guān),例如recipes,、planets、Pokémon等等,其神經(jīng)網(wǎng)絡(luò)正在嘗試最難學(xué)的部分。
Torch本身就是一個(gè)很好的學(xué)習(xí)框架,并不是完全因?yàn)镕B支持這個(gè)框架才被廣為稱道。

PaddlePaddle
PaddlePaddle是一個(gè)新的深度學(xué)習(xí)平臺(tái),它是由百度、中國(guó)谷歌的研究人員研究開發(fā)的。百度擁有一個(gè)相當(dāng)先進(jìn)的AI實(shí)驗(yàn)室,由前斯坦福大學(xué)教授負(fù)責(zé)管理。PaddlePaddle幾乎是谷歌開源深度學(xué)習(xí)優(yōu)勢(shì)的直接投射。
Paddle代表PArallel Distributed Deep LEarning,它被稱為易于使用,高效,靈活和可擴(kuò)展的深度學(xué)習(xí)平臺(tái)。它的入門界面對(duì)于深度學(xué)習(xí)的初學(xué)者來(lái)說(shuō)相當(dāng)有利,它有一些問(wèn)題集可以幫助開發(fā)者完成初始步驟。

CNTK
Microsoft的Cognitive Toolkit是一個(gè)深度學(xué)習(xí)的工具包,用于訓(xùn)練算法像人腦一樣學(xué)習(xí)。其在GitHub頁(yè)面指出,“微軟正在積極使用并不斷發(fā)展CNTK,同樣的,這時(shí)的CNTK也不是完美的,也會(huì)有錯(cuò)誤!
這個(gè)工具毫無(wú)疑問(wèn)地是使用神經(jīng)網(wǎng)絡(luò)來(lái)處理非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)集。CNTK具有更快的訓(xùn)練時(shí)間和易于使用的架構(gòu),可高度自定義,讓用戶選擇自己的參數(shù),算法和網(wǎng)絡(luò)。它用Python和C ++編寫。


2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
關(guān)于人臉識(shí)別系統(tǒng)項(xiàng)目還涉及到很多方面,首先是攝像頭(清晰度,運(yùn)動(dòng)物體捕捉),數(shù)據(jù)采集與存儲(chǔ)(網(wǎng)絡(luò),數(shù)據(jù)庫(kù)),后臺(tái)識(shí)別匹配系統(tǒng)(拿到真實(shí)環(huán)境還是誤差很大),通知日志系統(tǒng)等等。
后臺(tái)識(shí)別系統(tǒng),需要很多gpu資源。
關(guān)于具體用到什么學(xué)習(xí)框架,這個(gè)技術(shù)我不專業(yè),不好回答。項(xiàng)目號(hào)稱自主知識(shí)產(chǎn)權(quán),就判斷人臉這么簡(jiǎn)單的問(wèn)題也是通過(guò)多個(gè)算法綜合判斷給分的。

3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)質(zhì)何在?
對(duì)Python語(yǔ)言有所了解的都知道SciPy——一個(gè)開源的計(jì)算工具包;赟ciPy,目前開發(fā)者們針對(duì)不同的應(yīng)用領(lǐng)域已經(jīng)發(fā)展出了為數(shù)眾多的分支版本,它們被統(tǒng)一稱為Scikits。而在這些分支版本中面向機(jī)器學(xué)習(xí)的就是Scikit-learn。
Scikit-learn實(shí)現(xiàn)了一整套用于數(shù)據(jù)降維,模型選擇,特征提取和歸一化的完整算法/模塊,雖然缺少按步驟操作的參考教程,但Scikit-learn針對(duì)每個(gè)算法和模塊都提供了豐富的參考樣例和詳細(xì)的說(shuō)明文檔。





論壇徽章:
4
IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-04 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-10-10 06:20:002015亞冠之阿爾艾因
日期:2015-11-08 10:27:01CU十四周年紀(jì)念徽章
日期:2020-11-05 14:10:23
6 [報(bào)告]
發(fā)表于 2018-06-04 16:21 |只看該作者
1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?

   常用的開源框架很多,Scikit-Learn、spark上的mlib、hadoop上的mahout、微軟的機(jī)器學(xué)習(xí)工具集CNTK以及TensorFlow、Theano、Torch、Keras、Caffe、MXnet等深度學(xué)習(xí)框架。

2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
  
   接觸了一些這方面的業(yè)務(wù)。   象人臉識(shí)別系統(tǒng),一般是基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(CNN),系統(tǒng)搭建過(guò)程中根據(jù)情況選擇TensFlow、Caffe、Torch、Keras等深度學(xué)習(xí)框架即可。象過(guò)濾垃圾郵件,其實(shí)就是機(jī)器學(xué)習(xí)中的分類問(wèn)題,決策樹、隨機(jī)森林等分類算法都可實(shí)現(xiàn),選擇支持這些分類算法的框架即可。

3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)質(zhì)何在?

  對(duì)Scikit-Learn有些簡(jiǎn)單了解,基于python語(yǔ)言構(gòu)建的,操作比較簡(jiǎn)單。前些日子,遇到過(guò)一個(gè)信用卡風(fēng)險(xiǎn)識(shí)別的問(wèn)題,其實(shí)就是一個(gè)分類問(wèn)題,根據(jù)用戶的基本信息和用卡信息,來(lái)判斷風(fēng)險(xiǎn)高低,用Scikit-Learn中的分類算法很容易就實(shí)現(xiàn)。

論壇徽章:
32
CU大;照
日期:2013-05-20 10:45:13每日論壇發(fā)貼之星
日期:2015-09-07 06:20:00每日論壇發(fā)貼之星
日期:2015-09-07 06:20:00數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2015-12-13 06:20:0015-16賽季CBA聯(lián)賽之江蘇
日期:2016-03-03 11:56:13IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-03-06 06:20:00fulanqi
日期:2016-06-17 17:54:25IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-07-23 06:20:0015-16賽季CBA聯(lián)賽之佛山
日期:2016-08-11 18:06:41JAVA
日期:2016-10-25 16:09:072017金雞報(bào)曉
日期:2017-01-10 15:13:292017金雞報(bào)曉
日期:2017-02-08 10:33:21
7 [報(bào)告]
發(fā)表于 2018-06-04 16:49 |只看該作者
1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?
機(jī)器學(xué)習(xí)方面的開源工具有很多,常用的至少有如下幾個(gè):
1)TensorFlow
Google發(fā)布的內(nèi)部深度學(xué)習(xí)框架(人工神經(jīng)網(wǎng)絡(luò))。它可以通過(guò)將“神經(jīng)網(wǎng)絡(luò)”的典型數(shù)學(xué)運(yùn)算疊加在“計(jì)算圖”中來(lái)構(gòu)建任何類型的神經(jīng)網(wǎng)絡(luò)(以及其他計(jì)算模型)
2)Keras
Keras是深度學(xué)習(xí)框架的高級(jí)接口,它可以輕松創(chuàng)建常見類型的神經(jīng)元層,選擇度量,錯(cuò)誤函數(shù)和優(yōu)化方法,并且訓(xùn)練模型快速容易。
3)scikit-learn
scikit-learn包含幾乎所有可以想象的機(jī)器學(xué)習(xí)模型 - 從線性和邏輯回歸器到SVM分類器和隨機(jī)森林 - 它具有預(yù)處理方法(如降維,文本轉(zhuǎn)換等)的巨大工具箱。它具有各種分類,回歸和聚類算法,包括支持向量機(jī),隨機(jī)森林,梯度提升,k-均值和DBSCAN,并設(shè)計(jì)為與Python數(shù)值庫(kù)和科學(xué)庫(kù)NumPy和SciPy互操作。
4)Edward
Edward基于TensorFlow構(gòu)建,融合了三個(gè)領(lǐng)域:貝葉斯統(tǒng)計(jì)和機(jī)器學(xué)習(xí),深度學(xué)習(xí)和概率編程。
5)Lime
Lime是一個(gè)易于使用的Python軟件包,可以以更智能的方式解釋你的模型學(xué)到了什么。它運(yùn)行學(xué)習(xí)模型的第二個(gè)“元”逼近器,它近似模型對(duì)于不同輸入的行為。輸出是模型的解釋者,確定任何輸入的哪些部分幫助模型做出決定,哪些沒(méi)有。
6)Caffe
CAFFE(用于快速特征嵌入的卷積體系結(jié)構(gòu))是一個(gè)深度學(xué)習(xí)框架,最初由加州大學(xué)伯克利分校開發(fā)。它開源,以BSD許可證發(fā)布。Caffe使用C++編寫,并提供了一個(gè)Python接口。
7)H2Q Prediction Engine
H2O是用于大數(shù)據(jù)分析的開源軟件。它由H2O.ai公司生產(chǎn)。H2O允許用戶將數(shù)千個(gè)潛在模型作為發(fā)現(xiàn)數(shù)據(jù)模式的一部分。H2O軟件運(yùn)行可以從統(tǒng)計(jì)軟件包R、Python和其他環(huán)境中調(diào)用。
8)CNTK
CNTK是微軟的認(rèn)知工具包,是一個(gè)統(tǒng)一的深度學(xué)習(xí)工具,描述神經(jīng)網(wǎng)絡(luò)通過(guò)有向圖的一系列計(jì)算步驟,可以實(shí)現(xiàn)并結(jié)合流行的模型類型,如前饋DNN、卷積網(wǎng)絡(luò)CNN、循環(huán)網(wǎng)絡(luò)RNN/LSTM,實(shí)現(xiàn)了隨機(jī)梯度下降SGD、跨GPU和服務(wù)器的自動(dòng)差異和并行化的錯(cuò)誤后向傳播學(xué)習(xí)。
9)Apache MXNet
Apache MXNet是一個(gè)精干、靈活,和超級(jí)可擴(kuò)展深度學(xué)習(xí)框架,包括卷積神經(jīng)網(wǎng)絡(luò)(細(xì)胞神經(jīng)網(wǎng)絡(luò))和長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTMs)。
10)Core ML
來(lái)自Apple公司的經(jīng)過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)模型集成到iOS或MacOS應(yīng)用的框架。

2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
嗯,曾經(jīng)使用TensorFlow做過(guò)圖像識(shí)別,主要是識(shí)別圖像中的文字。
掌握TensorFlow很有難度,但幸運(yùn)的是,相關(guān)的資料比較多。

3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)勢(shì)何在?
Scikit-learn主要是用Python編寫的,用Cython編寫一些核心算法來(lái)實(shí)現(xiàn)性能。支持向量機(jī)器由LIBSVM周圍的Cython包裝器實(shí)現(xiàn) ; 邏輯回歸和線性支持向量機(jī)通過(guò)類似的LIBLINEAR包裝。
Scikit-Learn的優(yōu)點(diǎn)在于:
1)簡(jiǎn)單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具
2)可供所有人使用,并可在各種環(huán)境下重復(fù)使用
3)基于NumPy,SciPy和matplotlib
4)開源、可商業(yè)使用 - BSD許可證
5)功能足夠強(qiáng)大,能滿足大多數(shù)機(jī)器學(xué)習(xí)方面的需求

論壇徽章:
5
IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-25 06:20:002017金雞報(bào)曉
日期:2017-01-10 15:13:292017金雞報(bào)曉
日期:2017-02-08 10:33:2115-16賽季CBA聯(lián)賽之新疆
日期:2018-04-23 13:55:2315-16賽季CBA聯(lián)賽之遼寧
日期:2018-07-23 08:59:12
8 [報(bào)告]
發(fā)表于 2018-06-15 09:53 |只看該作者
1.目前,機(jī)器學(xué)習(xí)的常用開源工具有哪些?
其他不知道,, 我就知道tensflow,也正在學(xué)習(xí)使用中。
2.您是否接觸到此方面的業(yè)務(wù)?(比如人臉識(shí)別系統(tǒng),過(guò)濾垃圾郵件,記錄用戶特征等)如果接觸類似的業(yè)務(wù),在系統(tǒng)搭建過(guò)程中,是基于哪種學(xué)習(xí)框架?
暫時(shí)還沒(méi)有,不過(guò)想研究讓機(jī)器學(xué)習(xí)自動(dòng)調(diào)優(yōu)服務(wù)器配置,機(jī)器學(xué)習(xí)政策都是深度學(xué)習(xí)框架。
3.您了解Scikit-Learn?結(jié)合應(yīng)用場(chǎng)景,您認(rèn)為其優(yōu)質(zhì)何在?
Scikit-Learn了解了下,也是基于python的,感覺(jué)優(yōu)勢(shì)是在數(shù)據(jù)挖掘這一塊

論壇徽章:
32
CU大;照
日期:2013-05-20 10:45:13每日論壇發(fā)貼之星
日期:2015-09-07 06:20:00每日論壇發(fā)貼之星
日期:2015-09-07 06:20:00數(shù)據(jù)庫(kù)技術(shù)版塊每日發(fā)帖之星
日期:2015-12-13 06:20:0015-16賽季CBA聯(lián)賽之江蘇
日期:2016-03-03 11:56:13IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-03-06 06:20:00fulanqi
日期:2016-06-17 17:54:25IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-07-23 06:20:0015-16賽季CBA聯(lián)賽之佛山
日期:2016-08-11 18:06:41JAVA
日期:2016-10-25 16:09:072017金雞報(bào)曉
日期:2017-01-10 15:13:292017金雞報(bào)曉
日期:2017-02-08 10:33:21
9 [報(bào)告]
發(fā)表于 2018-07-19 14:27 |只看該作者
書挺不錯(cuò)的。

論壇徽章:
154
2022北京冬奧會(huì)紀(jì)念版徽章
日期:2015-08-07 17:10:5720周年集字徽章-年
日期:2022-10-26 16:44:2015-16賽季CBA聯(lián)賽之深圳
日期:2022-11-02 14:02:4515-16賽季CBA聯(lián)賽之八一
日期:2022-11-28 12:07:4820周年集字徽章-20	
日期:2023-07-19 08:49:4515-16賽季CBA聯(lián)賽之八一
日期:2023-11-04 19:23:5115-16賽季CBA聯(lián)賽之廣夏
日期:2023-12-13 18:09:34
10 [報(bào)告]
發(fā)表于 2019-08-24 14:37 |只看該作者
書讀了一些,沒(méi)有業(yè)余精力搞這塊,大家有沒(méi)有一起交流的。感覺(jué)很迫切,沒(méi)有環(huán)境,自己摸索太費(fèi)事


比如學(xué)習(xí)環(huán)境,我自己在debian 8下安裝的環(huán)境包,有些系統(tǒng)默認(rèn)的就不夠兼容。要升級(jí)新版本,系統(tǒng)默認(rèn)自帶的還要再卸載掉。。。大家用的什么環(huán)境的呢
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP