尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

spark 编写自定义业务代码 提交到远程 yarn 上进行运行spark on yarn

spark 编写自定义业务代码 提交到远程 yarn 上进行运行spark on yarn
📅 发布时间:2026/6/20 19:06:44

1、Scala代码编译打包

package scala
import org.apache.spark.sql.SparkSession
import scala.math.randomobject excutpi {def main(args: Array[String]): Unit = {//spark-submit --class scala.excutpi  --master yarn --queue root.dafault --deploy-mode client D:\hadoop\workCode\sparkhiveproject\target\sparkhiveproject-1.0-SNAPSHOT.jar// 创建 SparkSessionval spark = SparkSession.builder.appName("Spark Pi")// 注意:这里先设置为local[*]用于本地测试,提交到YARN时需要修改//.master("local[*]").getOrCreate()val slices = if (args.length > 0) args(0).toInt else 1000val n = math.min(100000L * slices, Int.MaxValue).toInt// 使用蒙特卡洛方法估算Pival count = spark.sparkContext.parallelize(1 until n, slices).map { i =>val x = random * 2 - 1val y = random * 2 - 1if (x*x + y*y <= 1) 1 else 0}.reduce(_ + _)println(s"Pi is roughly ${4.0 * count / (n - 1)}")spark.stop()}
}

  

package scalaimport org.apache.spark.SparkConf
import org.apache.spark.sql.SparkSessionobject localSparkToHive {def main(args: Array[String]): Unit = {val spark: SparkSession = SparkSession.builder().appName("Hive Integration")//.master("local[*]")//.config("spark.sql.warehouse.dir", "hdfs://hadoop01:9000/hivedata") // 配置master映射远程ip,window  hosts文件里面配置.config("hive.metastore.uris", "thrift://hadoop01:9083") //  配置远程 hive-site.xml  hive.metastore.uris//启用ACID配置.config("hive.support.concurrency","true").config("hive.txn.manager","org.apache.hadoop.hive.ql.lockmgr.DbTxnManager").config("spark.sql.storeAssignmentPolicy","LEGACY").config("spark.debug.maxToStringFields", "200").enableHiveSupport().getOrCreate()//查询示例//    val df = spark.sql("show tables")//    df.printSchema()spark.sql("SHOW DATABASES").show()spark.sql("USE test_db").count()
//    spark.sql("show tables").show()
//    spark.sql("SELECT * FROM test_db.room1 where address like '%剑河%' ").show(10)spark.sql("\nSELECT T.sname,T.ctfid,T.gender,\n       count(*) OVER(PARTITION BY T.gender) AS FM_CNT\n     " +"  FROM test_db.room3 T WHERE  T.address like \"%上海%\" AND instr(T.ctfid,'310')>0 \nORDER BY FM_CNT DESC LIMIT 100;").show()//        df.createTempView("room2")//  spark.sql("select * from room2_gender_out").show()// spark.sql("select t.gender,count(*) as cnt from test_db.room3 t group by t.gender").show()//    spark.sql("select a.gender,count(*) as cnt from test_db.room2 a " +//      "where length(TRIM(a.gender))>0 group by a.gender order by cnt desc").show()//启用ACID配置 -= 1//    spark.sql("SET hive.support.concurrency=true")//    spark.sql("SET hive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DbTxnManager")//    spark.sql("update test_db.employees set salary = 100.0 where id = 1").show();//    spark.sql("select * from test_db.employees").show();spark.close()}
}

2、Linux spark 把 打包代码 逻辑 提交到 yarn分布式集群进行运行

 spark-submit --class scala.excutpi  --master yarn --queue root.dafault --deploy-mode client sparkhiveproject-1.0-SNAPSHOT.jar 10000spark-submit --class scala.localSparkToHive  --master yarn --queue root.dafault --deploy-mode client sparkhiveproject-1.0-SNAPSHOT.jar

  

自动化学习。

相关新闻

  • 大模型Token计费精度提升:基于TensorRT时间戳
  • Java毕业设计:导师模棱两可修改建议「精准解读+落地方案」
  • S盒的扩散特性和雪崩准则

最新新闻

  • 影刀RPA子流程设计:让复杂流程变清晰
  • 2026年阿里云618 Hermes Agent/OpenClaw配置Token Plan详细步骤一文讲清
  • 2026年6月脉冲除尘滚振清理筛供货厂家怎么选择,脉冲除尘滚振清理筛/滚振组合清理筛,脉冲除尘滚振清理筛制造企业哪家专业 - 品牌推荐师
  • 2026年6月最新格拉苏蒂中国官方售后电话热线网点地址客服服务 - 亨得利官方服务中心
  • Windows风扇控制神器FanControl:5分钟打造静音高效散热系统
  • PIC17CXX外部SRAM接口设计:时序计算、硬件连接与调试实战

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号