基于Spark和Hadoop的規(guī)?;瘮?shù)據(jù)科學(xué)
時(shí)長(zhǎng):3天
課程概述:了解數(shù)據(jù)科學(xué)家的工作內(nèi)容、需要解決的問(wèn)題以及其處理現(xiàn)實(shí)問(wèn)題時(shí)應(yīng)用的方法, 以獲得來(lái)自不同行業(yè)數(shù)據(jù)的業(yè)務(wù)價(jià)值。實(shí)施自動(dòng)推薦系統(tǒng)。
培訓(xùn)對(duì)象:面向具備 Hadoop 基礎(chǔ)知識(shí)(HDFS、MapReduce、Hadoop Streaming、Hive) 的工程師、數(shù)據(jù)分析師、統(tǒng)計(jì)人員。培訓(xùn)對(duì)象應(yīng)具備熟練的腳本語(yǔ)言能力:Python 是;熟悉Perl或者Ruby也可。