雖然目前大數(shù)據(jù)的細(xì)分崗位比較多,但是主要集中在五個(gè)方面,分別是底層平臺(tái)研發(fā)、大數(shù)據(jù)應(yīng)用開發(fā)、大數(shù)據(jù)分析、大數(shù)據(jù)運(yùn)維和大數(shù)據(jù)教育。價(jià)值探討3、現(xiàn)在和未來4、大數(shù)據(jù)隱私二、大數(shù)據(jù)技術(shù)1、云計(jì)算2、分布式處理平臺(tái)(Hadoop)3、存儲(chǔ)技術(shù)4、感知技術(shù)三、實(shí)踐1、互聯(lián)網(wǎng)的大數(shù)據(jù)2、政府的大數(shù)據(jù)3、企業(yè)的大數(shù)據(jù)4、個(gè)人的大數(shù)據(jù)大數(shù)據(jù)的核心就是預(yù)測(cè)。
1、大數(shù)據(jù)是不是科學(xué),為什么?
先說觀點(diǎn),大數(shù)據(jù)是科學(xué)。這個(gè)問題其實(shí)挺難回答,因?yàn)樯婕暗絻蓚€(gè)比較難于理解的概念:“大數(shù)據(jù)”和“科學(xué)”,科學(xué)是正確反映世界本質(zhì)與規(guī)律的理論,不可證偽。大數(shù)據(jù)理論被數(shù)據(jù)科學(xué)家維克托·邁爾-舍恩伯格2008年在《大數(shù)據(jù)時(shí)代》中提出,大數(shù)據(jù)指是指無法用常規(guī)工具進(jìn)行處理、需對(duì)所有數(shù)據(jù)進(jìn)行分析處理的數(shù)據(jù)學(xué)科。如果要系統(tǒng)的認(rèn)知大數(shù)據(jù),就必須從三個(gè)層面來著手來分析他,具體的大家可以找相關(guān)的書籍來看:一、大數(shù)據(jù)理論1、大數(shù)據(jù)特征:具有5V特點(diǎn)Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性),
大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分。2、價(jià)值探討3、現(xiàn)在和未來4、大數(shù)據(jù)隱私二、大數(shù)據(jù)技術(shù)1、云計(jì)算2、分布式處理平臺(tái)(Hadoop)3、存儲(chǔ)技術(shù)4、感知技術(shù)三、實(shí)踐1、互聯(lián)網(wǎng)的大數(shù)據(jù)2、政府的大數(shù)據(jù)3、企業(yè)的大數(shù)據(jù)4、個(gè)人的大數(shù)據(jù)大數(shù)據(jù)的核心就是預(yù)測(cè),大數(shù)據(jù)將為人類的生活創(chuàng)造前所未有的可量化的維度。
2、學(xué)習(xí)大數(shù)據(jù)必須要學(xué)SQL嗎?為什么?
雖然目前大數(shù)據(jù)的細(xì)分崗位比較多,但是主要集中在五個(gè)方面,分別是底層平臺(tái)研發(fā)、大數(shù)據(jù)應(yīng)用開發(fā)、大數(shù)據(jù)分析、大數(shù)據(jù)運(yùn)維和大數(shù)據(jù)教育,除了底層平臺(tái)研發(fā)往往需要中高端人才以外,其他崗位的知識(shí)結(jié)構(gòu)并沒有太多的基礎(chǔ)性要求,下面對(duì)這幾大方面的知識(shí)結(jié)構(gòu)做一個(gè)具體的介紹。大數(shù)據(jù)應(yīng)用開發(fā)崗位需要的知識(shí)結(jié)構(gòu)包括大數(shù)據(jù)平臺(tái)體系結(jié)構(gòu)、編程語言、數(shù)據(jù)庫(NoSQL)、算法設(shè)計(jì)等內(nèi)容,可見在大數(shù)據(jù)應(yīng)用開發(fā)崗位需要掌握SQL,NoSQL的意思是NotonlySQL(不僅僅是SQL),不是說不需要SQL,
對(duì)于應(yīng)用程序開發(fā)人員來說,掌握SQL是基本的要求。大數(shù)據(jù)分析崗位的知識(shí)結(jié)構(gòu)包括大數(shù)據(jù)平臺(tái)體系結(jié)構(gòu)、編程語言、數(shù)據(jù)庫、算法設(shè)計(jì)、算法實(shí)現(xiàn)、數(shù)據(jù)呈現(xiàn)等內(nèi)容,大數(shù)據(jù)分析注重算法的設(shè)計(jì)與實(shí)現(xiàn),而數(shù)據(jù)呈現(xiàn)則往往需要通過SQL語言完成數(shù)據(jù)的提?。˙I),所以對(duì)于大數(shù)據(jù)分析人員來說是必須掌握SQL語言的,而且需要對(duì)SQL語言非常熟悉,
大數(shù)據(jù)運(yùn)維的知識(shí)結(jié)構(gòu)包括大數(shù)據(jù)平臺(tái)的搭建、組件部署、編程語言、平臺(tái)維護(hù)、網(wǎng)絡(luò)維護(hù)等內(nèi)容,對(duì)于運(yùn)維人員來說掌握SQL語言也是一個(gè)基本的要求,因?yàn)榇蟛糠诌\(yùn)維工作都需要對(duì)數(shù)據(jù)進(jìn)行操作,通過Shell(Python)來編寫運(yùn)維腳本是一個(gè)比較常見的做法。大數(shù)據(jù)教育則是為大數(shù)據(jù)行業(yè)提供人才培養(yǎng)的服務(wù),大數(shù)據(jù)教育更是涉及到以上各個(gè)崗位的知識(shí)結(jié)構(gòu),當(dāng)然需要掌握SQL語言了,
總之,目前大部分大數(shù)據(jù)崗位都是需要具備SQL基礎(chǔ)的,所以在學(xué)習(xí)大數(shù)據(jù)之前往往都先學(xué)習(xí)一下SQL和編程語言(Java、Python、Scala、R等)。大數(shù)據(jù)是我的主要研究方向之一,目前也在帶大數(shù)據(jù)方向的研究生,我會(huì)陸續(xù)在頭條寫一些關(guān)于大數(shù)據(jù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會(huì)有所收獲,如果有大數(shù)據(jù)方面的問題,也可以咨詢我,謝謝!。
3、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù),簡稱“大數(shù)據(jù)”,這個(gè)專業(yè)好不好?
回答:熱門而火爆的新興專業(yè),1.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù),簡稱“大數(shù)據(jù)”,是計(jì)算機(jī)、人工智能等多學(xué)科相互交叉的專業(yè)。2.大數(shù)據(jù)專業(yè),主要培養(yǎng)通過大數(shù)據(jù)思維,對(duì)大數(shù)據(jù)進(jìn)行開發(fā)運(yùn)用的高層次人才,畢業(yè)后,主要去向?yàn)檎?、企業(yè)、公司,具體行業(yè)為保險(xiǎn)、電子商務(wù)、銀行、金融、醫(yī)藥、互聯(lián)網(wǎng)等,3.自中科院首開“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)以來,截止目前,全國有近300所大學(xué)開設(shè)了大數(shù)據(jù)專業(yè),可見該專業(yè)的熱門程度。