Spark集群部署-PingCAP

Spark集群部署

网友投稿 687 2023-04-25

Spark集群部署

1. 安装环境简介

硬件环境：两台四核cpu、4G内存、500G硬盘的虚拟机。

软件环境：64位Ubuntu12.04 LTS；主机名分别为spark1、spark2，IP地址分别为1**.1*.**.***/***。JDK版本为1.7。集群上已经成功部署了Hadoop2.2，详细的部署过程可以参见另一篇文档Yarn的安装与部署。

2. 安装Scala2.9.3

2）解压下载后的文件，配置环境变量：编辑/etc/profile文件，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3 export PATH=$SCALA_HOME/bin

3）运行source /etc/profile使环境变量的修改立即生效。在spark2上执行相同的操作，安装scala。

4.配置conf/spark-env.sh环境变量，添加如下内容：

export SCALA_HOME=/home/test/spark/scala/scala-2.9.3

5. 在/etc/profile中配置SPARK_EXAMPLES_JAR以及spark的环境变量：添加如下内容：

export SPRAK_EXAMPLES_JAR=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2/examples/target/scala-2.9.3/spark-examples_2.9.3-assembly-0.8.1-incubating.jar export SPARK_HOME=/home/test/spark/spark-0.8.1-incubating-bin-hadoop2 export PATH=$SPARK_HOME/bin

6. 修改/conf/slaves文件，在文件中添加如下内容：

spark1 spark2

7.使用scp命令将上述文件拷贝到spark节点的相同路径下面scp -rspark-0.8.1-incubating-bin-hadoop2 test@spark2:/home/test/spark：

8. 在spark1上启动spark集群,并检查进程是否成功启动。如下master和worker已经成功启动。

9. 运行spark自带的例子：./run-exampleorg.apache.spark.examples.SparkPi spark://master:7077，其结果如下所示：

在web界面能看到刚才运行的job如下所示：

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

687 2023-04-25

Spark集群部署

黄东旭解析 TiDB 的核心优势

黄东旭关于基础软件产品价值的思考

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

Spark集群部署

微信扫一扫：分享

推荐文章

友情链接

热评文章