当前位置: 首页 > news >正文

跟着豆包学AI第四天(Windows版本)

今日主线安装Spark 3.5.0最适配 Ubuntu 24.04 Hadoop 3.3.x配置环境变量让 Spark连上 Hadoop测试运行 打开 Web UI1、确认你的 Hadoop 是启动的jps必须看到NameNode、DataNode、SecondaryNameNode、ResourceManager、NodeManager→5 个都有才继续2、下载 Spark适配 Hadoop3wget https://archive.apache.org/dist/spark/spark-3.5.0/spark-3.5.0-bin-hadoop3.tgz3、解压tar -zxvf spark-3.5.0-bin-hadoop3.tgz4、移动到用户目录重命名为 sparkmv spark-3.5.0-bin-hadoop3 ~/spark5、配置环境变量必须做nano ~/.bashrc在文件最后一行添加export SPARK_HOME$HOME/spark export PATH$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin export HADOOP_CONF_DIR$HADOOP_HOME/etc/hadoop export YARN_CONF_DIR$HADOOP_HOME/etc/hadoop保存退出CtrlO → 回车 → CtrlX生效source ~/.bashrc测试是否成功spark-submit --version出现版本号则成功6、复制配置模板cd ~/spark/conf cp spark-env.sh.template spark-env.sh cp spark-defaults.conf.template spark-defaults.conf67、编辑 spark-env.shnano spark-env.sh在最后一行添加export JAVA_HOME/usr/lib/jvm/java-8-openjdk-amd64 export HADOOP_CONF_DIR$HADOOP_HOME/etc/hadoop export YARN_CONF_DIR$HADOOP_HOME/etc/hadoop export SPARK_DIST_CLASSPATH$(hadoop classpath)保存退出CtrlO → 回车 → CtrlX8、编辑 spark-defaults.confnano spark-defaults.conf在最后一行添加spark.master yarn spark.eventLog.enabled true spark.eventLog.dir hdfs://localhost:9000/spark-logs spark.history.fs.logDirectory hdfs://localhost:9000/spark-logs保存退出CtrlO → 回车 → CtrlX9、在 HDFS 上创建 Spark 日志目录hdfs dfs -mkdir -p /spark-logs hdfs dfs -chmod 777 /spark-logs10、启动 Sparkstart-master.sh start-worker.sh spark://localhost:7077 start-history-server.sh查看进程jps必须看到MasterWorkerHistoryServer→3 个都有 Spark 启动成功11、测试 Spark 基础命令11.1、测试 1进入 Spark 交互窗口spark-shell进入后输入val rdd sc.textFile(README.md) rdd.count()出现数字 Spark 本地模式成功退出:quit11.2、测试 2Spark 跑在 YARN 上真正对接 Hadoopspark-submit \ --class org.apache.spark.examples.SparkPi \ --master yarn \ --deploy-mode client \ $SPARK_HOME/examples/jars/spark-examples_2.12-3.5.0.jar 10最后出现Pi is roughly 3.14xxxxSpark Hadoop 完全整合成功12、今天必须打开的 2 个 Web UISpark 集群管理http://localhost:8080Spark 历史任务查看http://localhost:18080两个都能打开 今天任务 100% 完成13、你今天必须记住的 8 条命令spark-submit --version # 查看版本 spark-shell # 进入交互界面 start-master.sh # 启动主节点 start-worker.sh # 启动工作节点 start-history-server.sh # 启动日志服务 jps # 查看进程 stop-all.sh # 关闭所有 spark-submit --master yarn # 提交到YARNHadoop第四天的内容很多其中也出现了很多问题欢迎大家积极尝试出现问题我们可以相互交流一起解决一下。有学习快的伙伴也可以私信我要完整的学习路径文件。
http://www.rkmt.cn/news/1399696.html

相关文章:

  • 别再只用摇杆移动了!解锁Joystick Pack插件的5个高级玩法(旋转、事件、状态机)
  • 【样式问题】将当前word所有文字样式、字体、字号大小 全局设置为以后任何一个新的空白文档都共享使用
  • Open Wallet Standard:为AI智能体构建安全可编程的加密金库
  • QGIS图层管理保姆级教程:从拖拽文件到批量导入,新手避坑指南
  • 从《原神》地图UI到FPS准星:拆解Unity坐标系在游戏开发中的5个高频应用场景
  • 别再让远处物体糊成马赛克了!Unity/UE4中Mipmap的正确打开方式与性能调优
  • 2026年Vibe Coding工具工程化困境与开发者应对策略
  • 3分钟搞定!这个开源神器如何让Windows图片浏览速度提升500%?
  • 亦唐科技国产贴片机的未来趋势与技术创新
  • 表观遗传学介绍表观遗传学的难点表观遗传学的重点
  • 拼多多大模型一面面试题
  • 【卷积神经网络CNN零基础入门】通俗图解原理+PyTorch实战,看懂计算机视觉核心
  • 技术壁垒与产品矩阵|猫原代细胞不可替代的科研价值与核心参数汇总
  • ZYGO白光干涉仪物镜系统结构特点与大视场(Large Field-of-View)实现途径探讨
  • 告别跳转失败:STM32 IAP升级中App过大导致的栈溢出问题分析与解决
  • 抗 DDoS 的核心:黑白名单、限速、流量牵引技术对比分析
  • 不止于移动:用Unity的Joystick插件为你的PC/主机游戏打造自定义控制器UI
  • 从合成数据到合成系统:AI数据生成的范式革命与实战指南
  • 山西正规的GEO优化企业有哪些
  • LP9962AA 保护机制全图解:8 重保护、150℃ 阈值、30℃ 迟滞
  • OpenEBS三大存储引擎怎么选?从MySQL到Kafka,手把手教你根据应用场景做决策
  • C#正课二十一(单例模式)
  • AI写的毕业论文初稿双率超标?怎么选靠谱的降重降AI工具
  • Android性能分析深度指南:Perfetto工具全面解析
  • DWM1000官方例程深度解剖:从工程结构到API接口,为移植到任意STM32平台铺路
  • 深入解析Linux触摸驱动:以RK3566泰山派与D310T9362V1SPEC屏幕为例
  • 突破尺度困境:10 米以上高挑空展陈的全维度设计思路
  • 多队列SSD与LSM树性能优化实践
  • Prometheus 拿短时任务没办法?试过才知道这个坑有多深
  • AI编程新范式:结构化指令驱动Claude Code构建项目管理UI