当前位置: 首页 > news >正文

spark启动方式

1.Spark Sql命令行

'''
// 启动 Spark SQL 命令行(类似 hive 命令)
$SPARK_HOME/bin/spark-sql

// 带参数的启动
$SPARK_HOME/bin/spark-sql
--master local[2]
--conf spark.sql.warehouse.dir=/path/to/warehouse
--database default
'''

2.Spark Shell交互式环境

'''
// 启动 Scala Spark Shell
$SPARK_HOME/bin/spark-shell

// 在 shell 中执行
scala> val df = spark.sql("SELECT * FROM users")
scala> df.show()
scala> :quit
'''

3.PySpark Shell

'''
// 启动 PySpark Shell
$SPARK_HOME/bin/pyspark

// 在 shell 中执行

df = spark.sql("SELECT name, age FROM people")
df.filter(df.age > 30).show()
exit()
'''

4.直接执行sql文件

'''
// 像 hive -f 一样执行 SQL 文件
$SPARK_HOME/bin/spark-sql -f query.sql

// 执行单条 SQL 语句
$SPARK_HOME/bin/spark-sql -e "SHOW TABLES"

// 执行多条 SQL 语句
$SPARK_HOME/bin/spark-sql -e "
SHOW DATABASES;
USE my_database;
SELECT count(*) FROM users;
"
'''

5.执行编译好的jar包

'''
// 提交编译好的 JAR 包
$SPARK_HOME/bin/spark-submit
--class com.mycompany.MySparkJob
--master yarn
--deploy-mode cluster
--executor-memory 2G
--num-executors 10
/path/to/my-spark-job.jar

// 提交 Python 脚本
$SPARK_HOME/bin/spark-submit
--master local[4]
--name "My Python Job"
/path/to/my_script.py
'''

http://www.rkmt.cn/news/51510.html

相关文章:

  • 20232411 2024-2025-1 《网络与系统攻防技术》实验五实验报告
  • 20232325 2025-2026-1 《网络与系统攻防技术》实验五实验报告
  • 鸿蒙应用开发实战:如何从0到1打造创新应用
  • 2025年11月防冻液厂家推荐榜:五家对比与性能评价一览
  • 2025年11月载冷剂厂家推荐榜:技术资质与口碑综合评测
  • 【第7章 I/O编程与异常】Python文件操作与上下文管理器的深度解析(避坑指南)
  • springboot生成前后端接口文档 - f
  • AI元人文:价值权衡的双模引擎与五维元问——构建人机共生的存在语法
  • Spring Cloud - Spring Cloud 注册中心与服务提供者(Spring Cloud Eureka 概述、微服务高效入门、微服务应用实例)
  • DateUtil
  • (链表)判断是否回文
  • (链表)判断两个单链表是否存在交点
  • (链表)任意删除一个结点
  • 在抖音直播推广开源作品的可行性?
  • DLSS Swapper商业模式:开源软件商业化探索 - 指南
  • irm steam.work|iex 风险分析
  • Pandas --DataFrame基本操作
  • 2025年11月全国旗杆厂家综合实力排行榜TOP5权威发布
  • 入侵防护技术深度解析:最新漏洞与威胁态势
  • 20232427 2025-2026-1 《网络与系统攻防技术》实验五实验报告
  • 解决Elctron打包成功,IPC无法注册问题。
  • 在Windows系统置顶窗口不被Win+D快捷键影响
  • 点分树
  • HTTP请求走私漏洞介绍 - 实践
  • 深入解析:Spring MVC 拦截器interceptor
  • 《重生之我成为世界顶级黑客》第八章:未来野望
  • 打开工作空间时,但未在 DTD/架构中声明
  • 从 LLM 到 Agentic AI:构建下一代智能平台的全栈路径
  • 20232418 2025-2026-1 《网络与系统攻防技术》实验五实验报告
  • Claude Code教程:从零构建AutoPost GPT自动内容生成系统