Kubernetes如何助力Spark大数据分析

这期内容当中小编将会给大家带来有关Kubernetes如何助力Spark大数据分析，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

成都创新互联专注于企业全网整合营销推广、网站重做改版、柳北网站定制设计、自适应品牌网站建设、H5建站、商城网站建设、集团公司官网建设、外贸网站制作、高端网站制作、响应式网页设计等建站业务，价格优惠性价比高，为柳北等各大城市提供网站开发制作服务。

Kubernetes如何助力Spark大数据分析

概述

本文为大家介绍一种容器化的数据服务Spark + OSS on ACK，允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。借助阿里云Kubernetes容器服务与阿里云OSS存储资源的深度整合，允许Spark分布式内存计算，机器学习集群对云上的大数据直接进行分析和保存结果。

先决条件

你已经通过阿里云容器服务创建了一个Kubernetes集群，详细步骤参见创建Kubernetes集群

从容器服务控制台创建一个Spark OSS实例

使用三次点击来创建一个1 master + 3 worker 的Spark OSS的实例

1 登录 https://cs.console.aliyun.com/
2 点击 “应用目录”
3 选择 "spark-oss", 点击 “参数”

给你的应用一个名字， e.g. spark-oss-online2

（必选）填写你的oss_access_key_id和oss_access_key_secret

Worker:
 # set OSS access keyID and secret
  oss_access_key_id: 
  oss_access_key_secret:

（可选）修改工作节点数目 Worker.Replicas:

4 点击 “部署”
5 点击 “Kubernetes 控制台”，查看部署实例

6 点击服务，查看外部端点, 点击URL访问Spark集群

7 测试Spark集群

打开一个spark-shell

kubectl get pod | grep worker

spark-oss-online2-worker-57894f65d8-fmzjs 1/1 Running 0 44m

spark-oss-online2-worker-57894f65d8-mbsc4 1/1 Running 0 44m
spark-oss-online2-worker-57894f65d8-zhwr4 1/1 Running 0 44m

kubectl exec -it spark-oss-online2-worker-57894f65d8-fmzjs --  /opt/spark/bin/spark-shell --master spark://spark-oss-online2-master:7077

粘贴下列代码，使用Spark测试OSS的读写性

// Save RDD to OSS bucket
val stringRdd = sc.parallelize(Seq("Test Strings\n Test String2"))
stringRdd.saveAsTextFile("oss://eric-new/testwrite12")

// Read data from OSS bucket
val lines = sc.textFile("oss://eric-new/testwrite12")
lines.take(10).foreach(println)

Test Strings
Test String2

CLI 命令行操作

Setup keys and deploy spark cluster in one command

export OSS_ID=
export OSS_SECRET=

helm install -n myspark-oss --set "Worker.oss_access_key_id="$OSS_ID",Worker.oss_access_key_secret="$OSS_SECRET incubator/spark-oss

kubectl get svc| grep oss
myspark-oss-master   ClusterIP      172.19.9.111              7077/TCP         2m
myspark-oss-webui    LoadBalancer   172.19.13.1     120.55.104.27   8080:30477/TCP   2m

上述就是小编为大家分享的Kubernetes如何助力Spark大数据分析了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注创新互联行业资讯频道。

当前名称：Kubernetes如何助力Spark大数据分析
网页地址：http://chengdu.cdxwcx.cn/article/pidipd.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

Kubernetes如何助力Spark大数据分析

Kubernetes如何助力Spark大数据分析

概述

先决条件

从容器服务控制台创建一个Spark OSS实例

CLI 命令行操作

Setup keys and deploy spark cluster in one command

其他资讯

http出现error503的解决方法-创新互联

如何理解Iptables-创新互联

Centos7.1部署mysql-5.6.34（笔记）-创新互联

JavaSpringBoot如何整合ActiveMQ-创新互联

怎么在Python中使用Selenium实现异步加载数据-创新互联

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

Kubernetes如何助力Spark大数据分析

Kubernetes如何助力Spark大数据分析

概述

先决条件

从容器服务控制台创建一个Spark OSS实例

CLI 命令行操作

Setup keys and deploy spark cluster in one command

其他资讯

http出现error503的解决方法-创新互联

如何理解Iptables-创新互联

Centos7.1部署mysql-5.6.34（笔记）-创新互联

JavaSpringBoot如何整合ActiveMQ-创新互联

怎么在Python中使用Selenium实现异步加载数据-创新互联

成都网站建设设计将想法与焦点和您一起共享