spark1.2.0版本搭建伪分布式环境 - stark_summer - ITeye博客

`

Stark_Summer

浏览: 709706 次
性别:
来自: 大连

最近访客更多访客>>

loginboot

街头诗人

ahww520

sz_jack

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

lixuanbin： iteye已经快要tj了吧。。
iteye为什么不支持markdown?
haorengoodman： Tachyon 能在做数据分类吗？例如我有一坨hdfs文件，将 ...
tachyon与hdfs,以及spark整合
lee3836：求源码，大牛
clover分布式任务调度系统
cfan37： ...
sparksql与hive整合
greemranqq： 9.9 送上，希望博客长久~。~
【【【【【#####>>>>>【关于我】【您·的·支·持·是·我·最·大·的·动·力】<<<<<#####】】】】】

spark1.2.0版本搭建伪分布式环境

博客分类：

spark

scala spark 分布式 spark shell job

阅读更多

、下载scala2.11.5版本，下载地址为：http://www.scala-lang.org/download/2.11.5.html

2、安装和配置scala：

第一步：上传scala安装包并解压

第二步配置SCALA_HOME环境变量到bash_profile

第三步 source 使配置环境变量生效：

第四步验证scala：

3、下载spark 1.2.0，具体下载地址：http://spark.apache.org/downloads.html

4、安装和配置spark：

第一步解压spark：

第二步配置SPARK_HOME环境变量：

第三步使用source生效：

进入spark的conf目录：

第四步修改slaves文件，首先打开该文件：

slaves修改后：

第五步配置spark-env.sh

首先把spark-env.sh.template拷贝到spark-env.sh：

然后打开“spark-env.sh”文件：

spark-env.sh文件修改后：

5、启动spark伪分布式帮查看信息：

第一步先保证hadoop集群或者伪分布式启动成功，使用jps看下进程信息：

如果没有启动，进入hadoop的sbin目录执行 ./start-all.sh

第二步启动spark：

进入spark的sbin目录下执行“start-all.sh”：

此刻我们看到有新进程“Master” 和"Worker"

我们访问“http://master:8080/”，进如spark的web控制台页面：

从页面上可以看到一个Worker节点的信息。

我们进入spark的bin目录，使用“spark-shell”控制台：

通过访问"http://master:4040"，进入spark-shell web控制台页面：

6、测试spark伪分布式：

我们使用之前上传到hdfs中的/data/test/README.txt文件进行mapreduce

取得hdfs文件：

对读取的文件进行一下操作：

使用collect命令提交并执行job：

readmeFile.collect

查看spark-shell web控制台：

states：

端口整理：

master端口是7077

master webui是8080

spark shell webui端口是4040

1
顶

1
踩

分享到：

Spark API编程动手实战-08-基于IDEA使用Sp ... | hadoop2.6.0版本搭建伪分布式环境

2015-02-09 11:18
浏览 5206
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Spark1.2.0单点或伪分布式安装总结.pdf: 由于之前在网上找的关于Spark搭建的资料都很老旧，大多时1.1之前的版本，于是自己安装后总结了一些相关知识，希望能和初学者共勉，也希望各位大神批评指正

spark 1.2.0 文档(spark-1.2.0-doc): spark-1.2.0 文档 api Spark Overview Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala and Python, and an optimized engine that supports ...

hbase-spark-1.2.0-cdh5.16.2.jar: HBaseContext所需要的jar包。由于不知道为啥maven配置仓库地址不生效。所以手动下载了个。导入本地环境的maven仓库。

seata-server-1.2.0.zip: seata-1.2.0,seata-server-1.2.0.zip,分布式事务，阿里分布式事务，阿里巴巴

芒果霸屏源码1.2.0版本: 芒果霸屏源码1.2.0版本

深入理解Spark+核心思想与源码分析.pdf: 《深入理解SPARK：核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析，旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家撰写。...

spark-1.3.1-bin-2.2.0_gong.tgz: spark-1.2.0-bin-hadoop2.4.tgz，用于hadoop2.4的spark1.2.0

reading-and-annotate-mesos-1.2.0:Apache开源分布式资源管理框架mesos原始代码注释分析，添加mesos_framework_demo，带详细注释: 阅读并注释mesos-1.2.0 Apache开源分布式资源管理框架mesos原始代码注释分析，添加mesos_framework_demo，带详细注释相关参考资料： LXC原始代码分析参考： docker源码注释分析参考：

TensorFlow1.2.0版本的Mac操作系统下载: 该压缩包含有TensorFlow1.2.0版本的Mac操作系统.whl文件

TensorFlow1.2.0版本的Linux操作系统下载: 该压缩包含有TensorFlow1.2.0版本的Linux操作系统.whl文件

hyperledger fabric 1.2.0版本.rar: Hyperledge fabric 环境搭建需要的2个二进制文件，1.2.0版本的（包含：hyperledger-fabric-linux-amd64-1.2.0.tar.gz 和 hyperledger-fabric-ca-linux-amd64-1.2.0.tar），官方下载，哇~~，真是慢的要死啦。...

Tiled-1.2.0-win64.zip: TiledMap1.2.0 Creator支持的最新版本，建议用此版本,Win 64 版本，官方地址：https://www.mapeditor.org/

Global site tag (gtag.js) - Google Analytics