首先我们通过帮助命令来看spark 如何提交执行jar包
spark-submit --help
spark-submit 详细参数说明
--master master 的地址,提交任务到哪里执行,例如 spark://host:port, yarn, local--deploy-mode 在本地 (client) 启动 driver 或者在 cluster 上启动,默认是 client--class 应用程序的主类,仅针对 java 或者 scala 应用--name 应用程序的名称--jars 用逗号分隔的本地 jar 包,设置后,这些 jar 将包含在 driver 和 executor 的 classpath 下--packages 包含在driver 和executor 的 classpath 中的 jar 的 maven 坐标--exclude-packages 为了避免冲突 而指定不包含的 package--repositories 远程 repository--conf PROP=VALUE 指定 spark 配置属性的值,例如 -conf spark.executor.extraJavaOptions="-XX:MaxPermSize=256m"--properties-file 加载的配置文件,默认为 conf/spark-defaults.conf--driver-memory Driver内存,默认 1G--driver-java-options 传给 driver 的额外的 Java 选项--driver-library-path 传给 driver 的额外的库路径--driver-class-path 传给 driver 的额外的类路径--driver-cores Driver 的核数,默认是1。在 yarn 或者者 standalone 下使用--executor-memory 每个 executor 的内存,默认是1G--total-executor-cores 所有 executor 总共的核数。仅仅在 mesos 或者者 standalone 下使用--num-executors 启动的 executor 数量。默认为2。在 yarn 下使用--executor-core 每个 executor 的核数。在yarn或者者standalone下使用
通过帮助文档我们可以知道启动 spark java jar 包的命令如下
spark-submit --master local --name MyWordCount --class com.river.WordCountDemon ~/Downloads/spark-demon-1.0-SNAPSHOT.jar ~/hadoop/spark/wordcount/text.txt
文档内容
hello frank
hello lucy
do you know that I miss you so much
long long age I know you , you know me
看到结果
(long,2)
(you,4)
(that,1)
(do,1)
(I,2)
(know,3)
(hello,2)
(age,1)
(so,1)
(frank,1)
(,,1)
(lucy,1)
(much,1)
(miss,1)
(me,1)
写给孩子的科学史 贪玩的人类 全套5册 9-14岁游戏的童年玩出来的进化论中国四大发明第三次浪潮科学先驱儿童科普百科全书
韧性时代 重新想象人类在地球上的生存与未来 杰里米里夫金著 第三次工业革命 零边际成本社会 作者重磅新作 中信出版社图书 正版
TD/T 1055-2019 第三次全国国土调查技术规程
肠道微生物组 见微知著的第三次医学革命 新生物学丛书 肠道微生物与慢性疾病 李莉莉 于广利 编著 9787030639974科学出版社
现货 高中学习的说明书 第三次修改版 船登惟希 日文原版 高校の勉強のトリセツ 三訂版【中商原版】
中国古代建筑史 第四卷 元 明建筑 中国古代建筑历史中的第三次发展高潮 元明时期的建筑 供建筑届人士建筑院校师生及广大读者参考