安装 Spark 集群

拉取镜像

docker pull tangchenyang/spark:v1.1

启动容器

docker run -itd --privileged --name spark \
-p 9870:9870 -p 8088:8088 -p 8042:8042 \
-p 4040:4040 -p 15002:15002 \
-p 10000:10000 \
tangchenyang/spark:v1.1

验证服务

进入容器

docker exec -it spark bash

HDFS

HDFS WEB UI

http://localhost:9870

HDFS 命令 Example

# list folders/files
hdfs dfs -ls /
# put file
hdfs dfs -put /root/software/hadoop-3.3.5/README.txt /
# list folders/files
hdfs dfs -ls /
# get file
cd ~
hdfs dfs -get /README.txt .
ls .

MapReduce

MapReduce Job Example

# 上传测试文件
hdfs dfs -mkdir /input
hdfs dfs -put /root/software/hadoop-3.3.5/README.txt /input/
hdfs dfs -ls /input

# 运行WordCount
hadoop jar ${HADOOP_HOME}/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5.jar wordcount /input/ /output

# 查看输出
hdfs dfs -ls /output
hdfs dfs -cat /output/part-r-00000

点击这里查看 WordCount 源码

YARN

YARN WEB UI

http://localhost:8088

YARN 命令 Example

# RUNNING 时
yarn application --list
# KILL RUNNING App
yarn application --kill <application_id>
# FINISHED 时
yarn application --list --appStates ALL

Hive

Hive 命令 Example

beeline -u jdbc:hive2://localhost:10000 -e "CREATE database test_db";
beeline -u jdbc:hive2://localhost:10000 -e "SHOW DATABASES";

Spark

Spark SQL Example

spark-sql -e "show databases"

Spark Job Example

spark-submit \
  --class org.apache.spark.examples.SparkPi \
  --master yarn \
  --deploy-mode client \
  ${SPARK_HOME}/examples/jars/spark-examples_2.12-3.5.5.jar \
  1000

Name		Name	Last commit message	Last commit date
Latest commit History 166 Commits
.github/workflows		.github/workflows
archived		archived
data_stack		data_stack
data_warehouse		data_warehouse
docker		docker
example		example
tests		tests
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

安装 Spark 集群

拉取镜像

启动容器

验证服务

进入容器

HDFS

HDFS WEB UI

HDFS 命令 Example

MapReduce

MapReduce Job Example

YARN

YARN WEB UI

YARN 命令 Example

Hive

Hive 命令 Example

Spark

Spark SQL Example

Spark Job Example

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

tangchenyang/bigdata_develop_platform

Folders and files

Latest commit

History

Repository files navigation

安装 Spark 集群

拉取镜像

启动容器

验证服务

进入容器

HDFS

HDFS WEB UI

HDFS 命令 Example

MapReduce

MapReduce Job Example

YARN

YARN WEB UI

YARN 命令 Example

Hive

Hive 命令 Example

Spark

Spark SQL Example

Spark Job Example

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages