Spark_2.2.0_ALS_recommend_scala
针对spark 2.2.0版本,从hive读取数据,转为rdd(由于scala 版本原因,用spark.ml会报错,只能用spark.mllib,所以会转为rdd),以及利用scala工具和sparkML相关工具包进行数据处理与建模,然后对模型进行详细评价,代码如下:
1 | import spark.implicits._ |
1 | // /home/shmc/spark_bak/bin/spark-shell --keytab shmc.keytab --principal shmc/bdoc@BCH --master yarn --queue root.bdoc.shmc --executor-memory 8g --executor-cores 8 --num-executors 64 --driver-memory 64g --conf spark.ui.port=5051 < ls_recomm_model.scala >als_recomm_model.log |