最近中文字幕高清中文字幕无,亚洲欧美高清一区二区三区,一本色道无码道dvd在线观看 ,一个人看的www免费高清中文字幕

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

如何用Python寫(xiě)spark?

如何用Python寫(xiě)spark?

如何用Python寫(xiě)spark
查看完整描述

1 回答

?
一只斗牛犬

TA貢獻(xiàn)1784條經(jīng)驗(yàn) 獲得超2個(gè)贊

1.RDD是PariRDD類(lèi)型
def add1(line):
return line[0] + line[1]
def add2(x1,x2):
return x1 + x2
sc = SparkContext(appName="gridAnalyse")
rdd = sc.parallelize([1,2,3])
list1 = rdd.map(lambda line: (line,1)).map(lambda (x1,x2) : x1 + x2).collect() #只有一個(gè)參數(shù),通過(guò)匹配來(lái)直接獲?。ㄙx值給里面對(duì)應(yīng)位置的變量)
list1 = rdd.map(lambda line: (line,1)).map(lambda x1,x2 : x1 + x2).collect() #錯(cuò)誤,相當(dāng)于函數(shù)有兩個(gè)參數(shù)
list2 = rdd.map(lambda line: (line,1)).map(lambda line : line[0] + line[1]).collect() #只有一個(gè)參數(shù),參數(shù)是Tuple或List數(shù)據(jù)類(lèi)型,再?gòu)募系膶?duì)應(yīng)位置取出數(shù)據(jù)
list3 = rdd.map(lambda line: (line,1)).map(add1).collect() #傳遞函數(shù),將Tuple或List類(lèi)型數(shù)據(jù)傳給形參
list4 = rdd.map(lambda line: (line,1)).map(add2).collect() #錯(cuò)誤,因?yàn)檩斎胫挥幸粋€(gè),卻有兩個(gè)形參
當(dāng)RDD是PairRDD時(shí),map中可以寫(xiě)lambda表達(dá)式和傳入一個(gè)函數(shù)。
a、寫(xiě)lambda表達(dá)式:
可以通過(guò)(x1,x2,x3)來(lái)匹配獲取值;或者使用line獲取集合,然后從集合中獲取。
b、傳入函數(shù)
根據(jù)spark具體的transaction OR action 操作來(lái)確定自定義函數(shù)參數(shù)的個(gè)數(shù),此例子中只有一個(gè)參數(shù),從形參(集合類(lèi)型)中獲取相應(yīng)位置的數(shù)據(jù)。



查看完整回答
反對(duì) 回復(fù) 2018-12-10
  • 1 回答
  • 0 關(guān)注
  • 1015 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)