在開始學(xué)習(xí)前給大家說下什么是Flink? 1.Flink是一個(gè)針對(duì)流數(shù)據(jù)和批數(shù)據(jù)的分布式處理引擎,主要用Java代碼實(shí)現(xiàn)。 2.Apache Flink作為Apache的頂級(jí)項(xiàng)目,F(xiàn)link集眾多優(yōu)點(diǎn)于一身,包括快速、可靠可擴(kuò)展、完全兼容Hadoop、使用簡(jiǎn)便、表現(xiàn)卓越。 通過以上的描述大家對(duì)Flink有了一個(gè)基本的認(rèn)識(shí),本套課程不會(huì)講解基礎(chǔ)內(nèi)容,因此建議有Flink基礎(chǔ)的同學(xué)進(jìn)行認(rèn)購(gòu)。 開始學(xué)習(xí)前建議大家認(rèn)真閱讀下文: 隨著人工智能時(shí)代的降臨,數(shù)據(jù)量的爆發(fā),在典型的大數(shù)據(jù)的業(yè)務(wù)場(chǎng)景下數(shù)據(jù)業(yè)務(wù)最通用的做法是:選用批處理的技術(shù)處理全量數(shù)據(jù),采用流式計(jì)算處理實(shí)時(shí)增量數(shù)據(jù)。在絕大多數(shù)的業(yè)務(wù)場(chǎng)景之下,用戶的業(yè)務(wù)邏輯在批處理和流處理之中往往是相同的。但是,用戶用于批處理和流處理的兩套計(jì)算引擎是不同的。 因此,用戶通常需要寫兩套代碼。毫無疑問,這帶來了一些額外的負(fù)擔(dān)和成本。阿里巴巴的商品數(shù)據(jù)處理就經(jīng)常需要面對(duì)增量和全量?jī)商撞煌臉I(yè)務(wù)流程問題,所以阿里就在想,我們能不能有一套統(tǒng)一的大數(shù)據(jù)引擎技術(shù),用戶只需要根據(jù)自己的業(yè)務(wù)邏輯開發(fā)一套代碼。這樣在各種不同的場(chǎng)景下,不管是全量數(shù)據(jù)還是增量數(shù)據(jù),亦或者實(shí)時(shí)處理,一套方案即可全部支持,這就是阿里選擇Flink的背景和初衷。
隨著互聯(lián)網(wǎng)不斷發(fā)展,數(shù)據(jù)量不斷的增加,大數(shù)據(jù)也是快速的發(fā)展起來了。對(duì)于電商系統(tǒng),擁有著龐大的數(shù)據(jù)量,對(duì)于這么龐大的數(shù)據(jù),傳統(tǒng)的分析已經(jīng)滿足不了需求。對(duì)于電商來說,大數(shù)據(jù)數(shù)據(jù)分析是很重要的,它承載著公司的戰(zhàn)略部署,以及運(yùn)營(yíng)、用戶體驗(yàn)等多方面的作用。因此企業(yè)對(duì)大數(shù)據(jù)人才的需求會(huì)持續(xù)旺盛,優(yōu)秀的大數(shù)據(jù)人才年收入在50-100萬。 目前經(jīng)過10多年的發(fā)展大數(shù)據(jù)技術(shù)也在不斷的更新和進(jìn)步中,大數(shù)據(jù)計(jì)算引擎經(jīng)歷了幾個(gè)過程,從一代的Hadoop Mapreduce、二代的基于有向無環(huán)圖的TeZ,OOZIE等,到三代的基于內(nèi)存計(jì)算的Spark,再到最新的第四代Flink。 早期的Hadoop開發(fā)通過搭建環(huán)境收入都可以輕松破萬,到如今Flink的崛起,相信更多的先機(jī)者會(huì)看到Flink的機(jī)遇。對(duì)于Flink巨頭們?cè)缫呀?jīng)應(yīng)用的非常成熟,比如阿里、Uber、美團(tuán)等互聯(lián)網(wǎng)巨頭,因此Flink使用會(huì)越來越多,這是趨勢(shì),現(xiàn)在很多公司都在往Flink轉(zhuǎn)換,足以可見Flink技術(shù)的先進(jìn)和強(qiáng)大。
本課程將基于真實(shí)的電商分析系統(tǒng)構(gòu)建,通過Flink實(shí)現(xiàn)真正的實(shí)時(shí)分析,該系統(tǒng)會(huì)從無到有一步一步帶大家實(shí)現(xiàn),讓大家在實(shí)操中快速掌握Flink技術(shù)。
課程所涵蓋的知識(shí)點(diǎn)包括:Flink、Kafka、Flume、Sqoop、SpringMVC、Redis、HDFS、Mapreduce、Hbase、Hive、SpringBoot、SpringCloud等等
分析指標(biāo)包含:頻道分析、產(chǎn)品分析、用戶分析、活動(dòng)效果分析、營(yíng)銷分析、購(gòu)物車分析、訂單分析等
課程所用到的 開發(fā)環(huán)境為:Window7 開發(fā)工具為:IDEA 開發(fā)版本為:Flink1.6.1、Hadoop2.6.0、Hbase1.0.0、Hive1.1.0
學(xué)完該課程大家會(huì)對(duì)Flink有非常深入的了解,同時(shí)可以體會(huì)到Flink的強(qiáng)大之處,以及可以結(jié)合自己公司的業(yè)務(wù)進(jìn)行使用,減少自己研究和學(xué)習(xí)Flink的時(shí)間。
|