Changes between Version 5 and Version 6 of NTUOSS160412/HW1


Ignore:
Timestamp:
Apr 11, 2016, 5:54:18 PM (8 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • NTUOSS160412/HW1

    v5 v6  
    1 = 作業一 =
     1◢ <[wiki:NTUOSS160412/Lab7 實作七]> | <[wiki:NTUOSS160412 回課程大綱]> ▲ | > ◣
    22
    3  * 題目:請參考 hadoop_labs/lab010 改成逆向索引(Reverse Index)。使 !ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。
     3= 作業 =
     4
     5 * 題目:請參考 hadoop_labs/lab009 改成逆向索引(Reverse Index)。使 !ReverseIndex 執行之結果為「"關鍵字"\t"檔案名稱(用逗點隔開)"」型態。
    46 * 參考步驟:[[BR]]Here is the reference steps:
    57{{{
     
    810~$ echo "I like ntu Course, and we enjoy this course." > hw1_input/input2
    911~$ hadoop fs -put hw1_input hw1_input
    10 ~$ hadoop jar WordCount hw1_input hw1_out
     12~$ hadoop jar WordCount.jar hw1_input hw1_out
    1113~$ hadoop fs -cat hw1_out/part-00000
    1214}}}
    1315 * 參考結果應該為:(路徑不限)[[BR]]The reference result should be as following:(no limitation for the format of "path")
    1416{{{
    15 and     input2
    16 course  input1,input2,input2
    17 enjoy   input2
    18 i       input1,input2
    19 like    input1,input2
    20 ntu     input1,input2
    21 this    input2
    22 we      input2
    2317}}}
    2418 * 繳交期限:2016年5月2日(一) 上午 11:59
     
    3024  * 試將出現次數統計加入結果,亦即參考結果如下:[[BR]]Try to add count of each file in the result, i.e. The reference result should be as following:
    3125{{{
    32 and     input2(1)
    33 cloud   input1(1),input2(1)
    34 course  input1(1),input2(2)
    35 enjoy   input2(1)
    36 i       input1(1),input2(1)
    37 like    input1(1),input2(1)
    38 nctu    input1(1),input2(1)
    39 this    input2(1)
    40 we      input2(1)
    4126}}}
    4227 * 配分比例: