Spark-SQL连接Hive
Apache Hive是Hadoop上的SQL引擎,Spark SQL编译时可选择是否包含Hive支持。包含Hive支持的版本支持Hive表访问、UDF及HQL。生产环境推荐编译时引入Hive支持。
内嵌Hive
直接使用无需配置,但生产环境极少采用。
外部Hive
需完成以下配置:
将hive-site.xml拷贝至conf目录
修改数据库连接地址(如jdbc:mysql://node01:3306/myhive )
拷贝MySQL驱动到jars目录
拷贝core-site.xml和hdfs-site.xml到conf目录
重启spark-shell
Spark Beeline
基于HiveServer2实现的Thrift服务,兼容HiveServer2协议:
配置hive-site.xml和MySQL驱动
启动Thrift Server
使用beeline连接:beeline -u jdbc:hive2://node01:10000 -n root
Spark-SQL CLI
类似Hive命令行工具:
拷贝MySQL驱动到jars目录
放置hive-site.xml到conf目录
执行bin/spark-sql启动
代码操作Hive
需添加依赖:
关键代码步骤:
设置HADOOP_USER_NAME解决权限问题
配置spark.sql.warehouse.dir指定仓库路径
通过SparkSession执行建库、查库等DDL操作
数据加载与保存
提供通用API支持多种数据格式,默认使用Parquet格式。
通用操作
加载数据:spark.read.format("格式").load("路径")
保存数据:df.write.format("格式").mode("模式").save("路径")
支持格式:csv/json/orc/parquet/textFile/jdbc
Parquet
默认数据源,支持嵌套数据存储
直接使用load/save方法操作
可配置spark.sql.sources.default修改默认格式
JSON
自动推断结构,要求每行为完整JSON
加载:spark.read.json("path")
创建临时表后执行SQL查询
MySQL
依赖mysql-connector-java
两种连接方式:
通过options配置参数
使用Properties对象设置连接属性
支持Append/Overwrite等保存模式
CSV
配置选项:sep(分隔符)、header(表头)、inferSchema(自动推断类型)
文件内容课堂总结
2025/4/19 12:07:45
来源:https://blog.csdn.net/2301_79975534/article/details/147284716
浏览:
次
关键词:文件内容课堂总结
版权声明:
本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。
我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com
热文排行
最新新闻
- 文件内容课堂总结
- 第五章 5.2ESP32物联网应用:HTTP与Web服务器详细教学
- 容器初始化Spring Boot项目原理,即web项目(war)包涉及相关类对比详解
- Android Framework WMS全面概述和知识要点
- 数字化工厂EasyCVR视频监控智能解决方案:引领工业4.0时代新趋势
- iPaaS集成平台在制造业有哪些应用场景
- 【Linux篇】深入理解文件系统:从基础概念到 ext2 文件系统的应用与解析
- CS5346 - CHARTS: Chart with Point / Bar / Line / Box
- vue3相关面试问题
- layui改造优化ITtools技术笔记01—layui.js重要修正
推荐新闻
- 文件内容课堂总结
- 第五章 5.2ESP32物联网应用:HTTP与Web服务器详细教学
- 容器初始化Spring Boot项目原理,即web项目(war)包涉及相关类对比详解
- Android Framework WMS全面概述和知识要点
- 数字化工厂EasyCVR视频监控智能解决方案:引领工业4.0时代新趋势
- iPaaS集成平台在制造业有哪些应用场景
- 【Linux篇】深入理解文件系统:从基础概念到 ext2 文件系统的应用与解析
- CS5346 - CHARTS: Chart with Point / Bar / Line / Box
- vue3相关面试问题
- layui改造优化ITtools技术笔记01—layui.js重要修正