可以单机运行,建议在hadoop集群上运行
详见实验报告
hadoop jar cf.jar com.mapreduce.t1.WordCountDriver [输入路径] [输出路径] [缓存路径]
1.创建input文件夹放入csv 运行t1(无缓存)
hadoop jar cf.jar com.mapreduce.t1.WordCountDriver
2.运行t2 (将t1结果当作缓存)
hadoop jar cf.jar com.mapreduce.t2.UserCollectDriver
3.将output2结果复制到input3里 运行t3(无缓存)
hadoop jar cf.jar com.mapreduce.t3.CooccurrenceDriver
4.将output3结果复制到input4里 运行t4(将t1结果当作缓存)
hadoop jar cf.jar com.mapreduce.t4.SimilarDriver
5.将output2结果复制到input5里 运行t5(将t4结果当作缓存)
hadoop jar cf.jar com.mapreduce.t5.UserJoinDriver
6.将output5结果复制到input6里(将t1结果当作缓存) 运行t6
hadoop jar cf.jar com.mapreduce.t6.RecommandDriver