16个非常实用的大数据工具

  • 时间:2018-10-10 23:29 作者:大数据信息站 来源:大数据信息站 阅读:78
  • 扫一扫,手机访问
摘要:Apache Hadoop是目前最成熟的大数据分析工具,但是市场上也不乏其余优秀的大数据工具。目前市场上有数千种工具能够帮你节约时间和成本,带你从全新的角度洞察你所在的行业。随着大数据市场的稳步发展,越来越多的公司开始部署大数据驱动战略。Apache Hadoop是目前最成熟的大数据分析工具,但是市

Apache Hadoop是目前最成熟的大数据分析工具,但是市场上也不乏其余优秀的大数据工具。目前市场上有数千种工具能够帮你节约时间和成本,带你从全新的角度洞察你所在的行业。

随着大数据市场的稳步发展,越来越多的公司开始部署大数据驱动战略。

Apache Hadoop是目前最成熟的大数据分析工具,但是市场上也不乏其余优秀的大数据工具。目前市场上有数千种工具能够帮你节约时间和成本,带你从全新的角度洞察你所在的行业。大家可关注weixin公众号:大数据技术工程师 有更多大数据精彩内容等你来看,还有大数据学习资料免费领取哦,回复关键字就可。

以下详情16种功能实用的大数据工具:

1,Avro:由Doug Cutting公司研发,可用于编码Hadoop文件模式的数据序列化。

2,Cassandra:一种分布式的开源数据库。可用于解决商品服务器在提供高可用性服务时产生的大量分布式数据。这是一种非关系型数据库(NoSQL)处理方案,最初由Facebook主导研发。

目前很多公司组织都在使用这一数据库,如Netflix,Cisco,Twitter。

3,Drill:一种开源分布式系统,用于大规模数据集的交互分析。Drill与谷歌的Dremel系统相似,由Apache公司管理运行。

4,Elasticsearch:Apache Lucene开发的开源搜索引擎。Elasticsearch是基于Java的系统,可以实现高速搜索,支持你的数据搜索工作。

5,Flume:使用网络服务器、应用服务器和移动服务器的数据来填充Hadoop的大数据应用框架,是数据源和Hadoop之间的一种连接纽带。

6,HCatalog:是针对Apache Hadoop的集中元数据管理和分享服务。可以通过它集中查看Hadoop集群中的所有数据,并可以在不知道数据在集群中存储位置的情况下,通过Pig和 Hive等多种工具解决所有数据元素。

7,Impala: 使用与Apache Hive相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和客户界面(HueBeeswax),直接帮助您对存储在HDFS或者HBase中的Apache Hadoop数据进行快速的交互式SQL查询。

它为批量导向或者实时查询提供了一个方便操作的统一平台。

8,JSON:今天的许多非关系型数据库(NoSQL)都以JSON(JavaScript对象符号)格式存储数据,这些格式在Web开发人员中很受欢迎。

9,Kafka:这是种分布式“发布——订阅”的消息传送系统,它能够提供一种处理方案,帮助解决所有数据流活动,并在消费者网站上解决这些数据。

这种类型的数据(包括页面查看数据,搜索数据和其余客户操作数据)是当前社交网络的关键组成部分。

10,MongoDB:是一个在开源概念指导下开发出来的面向文档的非关系型数据库(NoSQL)。它具备完整的索引支持,同时可以灵活地对任何属性进行索引,并在不影响功能的情况下进行横向扩容。

11,Neo4j:是一个图形数据库,与关系数据库相比,性能提升高达1000多倍或者更高。

12,Oozie:一种工作流程解决系统,可以让客户自己设置不同语言编写的一系列工作,如Map Reduce,Pig 和 Hive。它还可以实现不同工作项目之间的智能连接,Oozie还支持客户指定依赖关系。

13,Pig:是由雅虎开发的基于Hadoop的一种语言,对于客户来说,学习起来相对简单,且Pig擅长解决非常深入且非常长的数据管道(data pipeline)。

14,Storm:是一种免费的进行实时分布式计算的开源系统。通过Storm,客户可以非常轻松的在能够进行实时解决操作的范围内,对非结构化数据流进行可靠解决。

系统具备容错特性,支持几乎所有编程语言,当然最常用的语言还是Java。Storm最初是Apache家族的一个分支,现在已被Twitter收购。

15,Tableau:是一种主要关注商业智能的数据可视化工具。客户无需编程,即可以利用Tableau创立地图,条形图,散点图等可视化图像。

他们最近发布了一个Web连接器,允许客户直接连接数据库或者应用程序界面(API),从而使客户能够在进行可视化项目时获取实时数据。

16,ZooKeeper:为大型分布式系统提供集中配置和开放代码名称注册的服务。

每天大数据技术领域都会涌现出大量新的大数据相关工具,要想学会使用每个工具是非常困难且没有意义的。筛选几个你能够熟练使用的工具,并不断学习技术知识,才是最好的方式。

,

  • 全部评论(0)
手机二维码手机访问领取大礼包
返回顶部