博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hive
阅读量:7094 次
发布时间:2019-06-28

本文共 503 字,大约阅读时间需要 1 分钟。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

Hive定义

Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。
Hive 没有专门的数据格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允许用户指定数据格式。

转载于:https://www.cnblogs.com/xtdxs/p/6618926.html

你可能感兴趣的文章
JVM的参数
查看>>
我的友情链接
查看>>
数组做参数
查看>>
简述c语言的优缺点
查看>>
Linux设置用户登录提示
查看>>
Python调用第三方接口实现nagios短信报警
查看>>
centos修改大文件打开数(永久有效)
查看>>
mysql更改已有数据表的字符集,保留原有数据内容
查看>>
HiPER 840负责均衡问题
查看>>
OPENCV Show IplImage on MFC Window
查看>>
迁移SQL数据库五招
查看>>
maven引用本地jar
查看>>
mac下安装与配置MySQL
查看>>
LNMP搭建5:php-fpm配置文件
查看>>
我的友情链接
查看>>
htonl、ntohl、htons、ntohs函数实现
查看>>
写笔记笔记 关于数据库的隔行操作
查看>>
Tomcat 配置虚拟目录
查看>>
我的友情链接
查看>>
Windows下使用脚本语言操作文件系统之四-Drive对象
查看>>