@tsing1226 2016-05-04T07:44:40.000000Z 字数 834 阅读 1014

spark

Spark 集群脚本的书写

在Spark配置文件夹 conf下创建文件slaves,该文件中必须包含spark worker的所有主机名。

$mkdir -p /conf/slaves
master主机对其他worker机器中的通过SSH进行无密钥访问。如果没有设置SSH无密钥访问，你可以设置SPARK_SSH_FOREGROUND环境变量为每个worker设置密码。
根据SPARK_HOME/bin下的脚本启动/停止Spark集群
- sbin/start-master.sh - Starts a master instance on the machine the script is executed on.
- sbin/start-slaves.sh - Starts a slave instance on each machine specified in the conf/slaves file.
- sbin/start-all.sh - Starts both a master and a number of slaves as described above.
- sbin/stop-master.sh - Stops the master that was started via the bin/start-master.sh script.
- sbin/stop-slaves.sh - Stops all slave instances on the machines specified in the conf/slaves file.
- sbin/stop-all.sh - Stops both the master and the slaves as described above.

注意：这些脚本的执行必须在你想要运行的spark master机器之上，而不是在本地机器上。
4. （可选）配置环境变量
修改配置文件conf/spark-env.sh
5.启动集群

./sbin/start-master.sh

6.将应用程序部署到集群上

./bin/spark-shell --master spark://IP:PORT

内容目录

- - CLI 1
  - windows命令行
- - Gradle 1
  - gradle知识一览
- - Scala 1
  - Scala语言初识
- - cmd 1
  - windows命令行
- - cmdMarkDown练习 1
  - cmdMarkDown练习
- - eclipse 1
  - hadoop2.7.2开发环境搭建
- - flume 2
  - Flume实时收集日志文件至HDFS文件系统案例
  - 文件收集工具Flume
- - hadoop 9
  - hadoop2.7.2开发环境搭建
  - Hadoop2.7.2 HA搭建
  - hadoop短路本地读
  - Hadoop2.7.2 DistCp Version2
  - HDFS相关概念
  - Hadoop High Availability简介及部署
  - Hadoop2.5.0编译及伪分布搭建
  - Hadoop High Availability简介及部署
  - Hadoop2.5.0编译教程
- - hbase 5
  - hbase NAMESPACE简单操作
  - hbase 安全配置
  - hbase，mapreduce and classpath
  - 启动hbase shell时出现的问题
  - HBase基础认识
- - hive 11
  - Hive日志分析案例--日志流量分析案例1
  - Hive日志分析案例--日志流量分析案例2
  - Hive安装部署
  - 浅谈Hive数据倾斜
  - 问题反馈：hive set reduce失败
  - Hive案例分析与实践
  - Hive UDF编程案例
  - Hive Strict Mode
  - Hive高级进阶--企业优化
  - Hive中的不同的文件格式测试--ORC AND PARQUET
  - Hive高级进阶--压缩技术
- - hue 2
  - Hue与Oozie集成配置和使用
  - Hadoop可视化工具hue
- - java 23
  - 异常The specified JRE installation does not exist
  - java读取properties文件
  - java collection
  - 迭代器的一般使用
  - 字节数组与字符串之间相互转化
  - 读取xml文件文件内容
  - continue语句
  - break语句
  - String,StringBuffer,StringBuilder的区别
  - java代码调用shell脚本
  - java远程调用shell脚本
  - java类中调用方法时必须用static关键字吗
  - 如何高效的书写java代码
  - Java 语言中 Enum 类型的使用介绍
  - java中数组遍历所有元素
  - Try -Catch-Finally Blocks介绍
  - map对象遍历
  - ArrayList遍历访问的几种方式
  - java项目打包maven pom.xml配置
  - logback设置
  - JDK/MAVEN在windows下的环境配置
  - Maven安装
  - JDK环境变量配置
- - linux 9
  - linux下时间同步
  - 参考文献
  - 普通用户拥有root权限
  - 时间戳
  - linux nano命令
  - Linux安装多版本的JDK
  - centos安装scala
  - 时间服务器搭建
  - 时间服务器搭建
- - logback 1
  - logback设置
- - mapreduce 2
  - hadoop2.7.2开发环境搭建
  - MapReduce Shuffle过程
- - maven 6
  - 创建maven项目jdk默认是1.5修改
  - maven编译-DskipTests与-Dmaven.test.skip=true的区别
  - 运用maven对java项目进行打包
  - 如何在maven项目中的pom文件中添加oracle ojdbc驱动
  - java项目打包maven pom.xml配置
  - JDK/MAVEN在windows下的环境配置
- - mysql 2
  - 窗口函数一瞥
  - Centos MySQL
- - oozie 9
  - 开源的资源调度框架
  - Oozie工作流调度框架
  - Oozie workflow中四个Action解析
  - Hue与Oozie集成配置和使用
  - Oozie workflow中四个Action解析--Shell Action
  - Oozie workflow中四个Action解析--Sqoop Action
  - oozie coordinator
  - Oozie workflow中四个Action解析--Hive Action
  - Oozie workflow中四个Action解析--MapReduce Action
- - oracle 1
  - 如何在maven项目中的pom文件中添加oracle ojdbc驱动
- - server 1
  - tomcat 界面角色管理器GUI
- - shell 1
  - Shell脚本书写
- - spark 7
  - Spark宽依赖与窄依赖
  - spark1.3.0硬件配置
  - Spark 集群脚本的书写
  - Spark RDD及操作
  - IDEA安装部署
  - Spark1.3.0部署及应用示例
  - Spark编译
- - spring 2
  - spring集合（Lists、set、map和properties）
  - spring加载配置文件xml文件的几种方式
- - sqoopHADOO 1
  - SQOOP协作框架
- - windows 2
  - windows命令行
  - JDK/MAVEN在windows下的环境配置
- - yarn 1
  - apache hadoop yarn
- - zookeeper 1
  - Zookeeper搭建
- - 数组 1
  - java中数组遍历所有元素
- - 未整理 1
  - 杂技
- - 杂技 1
  - 杂技人生
- - 编程 2
  - Log4j详细介绍
  - JDK/MAVEN在windows下的环境配置
- - 需要解决的问题 1
  - lkl
- - 未分类 4
  - java读取properties文件的当前路径
  - 待整理的知识点
  - Lakala笔记
  - 大数据框架介绍
- 以下【标签】将用于标记这篇文稿：

添加新批注

在作者公开此批注前，只有你和作者可见。

私有
公开
删除

回复批注