Archive

keep hungry keep foolish
2018


























































































































































elasticsearch2.4.0和hive集成,jdbc创建索引


Hive常用的SQL命令操作


JDBC连接impala Java连接Hive JDBC连接Hive


Hive_应用设计


第6课:SparkStreaming源码解读之Job动态生成和深度思考


hive的join和复合数据类型


RDDs, DataFrames, and Datasets


spark 2.2.0 wordcount python版


Hive + Hbase


hive源码调试


hadoop上安装hive2.3.2学习总结—hive安装+mysql以及碰到坑点


Hadoop之Hive架构详解及应用


spark 运行模式的简单总结


spark任务启动脚本备忘


Hive:和关系型数据库的区别


SparkSQL:Spark整合Hive


Hadoop集群环境下的 HDFS shell 命令


Hive创建索引


Hive和不同关系型数据库的差异


25分钟掌握Hive基本操作


Hive之——数据操作


hive数据库基础学习


【Kafka】消息队列-kafka安装(windows)


hadoop是什么?能做什么?


hive安装过程中的一个问题 return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask.


HIVE详解


hive命令学习


spark-Spark Configuration


Hive内置数据类型


Hive数据源的安装与配置


HBase Memstore理解笔记


Hive操作HBase总结


Spark是什么


Hive和Hbase整合


很诡异,给hive中的数据表导入数据,出现的问题?


hive 集成sentry


Hadoop伪分布式环境以及开发环境搭建


如何设置hive与hbase同步


Apache Spark - Building Spark with Maven(使用Maven构建Spark)


Hive数据的导入导出和查询方式


Hive(二) - 元数据库


hive数据库操作——hive命令行


MetaException(message:Hive Schema version 2.1.0 does not match metastore's schema version 1.2.0 Meta


hive(三)--从hbase映射数据到hive中


hive数据表清洗


HiveQL:数据定义


安装配置hadoop


第六天 -- Kafka API -- Spark Streaming -- DStream


Hive 安装


索引、分区和分桶的区别


hive远程debug


hive基础命令实验


Spark Streaming Dynamic Resource Allocation


Spark学习,pyspark执行后默认启动Ipython


spark standalone mode


Hive执行过程


ubuntu下Hive安装


spark基础


Hive体系结构(三)元数据库与基本操作


关于kafka的一点理解


极客时间:从0开始学大数据 13 | 同样的本质,为何Spark可以更高效?


Kafka(一)——安装与使用


Flume 的基本使用


Kafka(一)基本概念


Kafka(二)安装,配置和使用


Hive 内置服务的区别


Spark 的shuffle流程框架以及源码详解(匠心巨作)(1)


什么是Kafka


HDFS 相关


流式计算基础-2-2


启动Hive时,出现Hive metastore database is not initialized


HBase学习笔记 (叁)- HBase进阶


sqoop从关系库导出数据到hive


Flume把网络流量存入日志文件


hbase文档集合


hive数据库定义


Hive命令行常用操作(数据库操作,表操作)


从无到有系列之flume-安装部署01


Hive 数据类型 文件格式


sqoop从mysql到数据到hadoop中


Hadoop Archives *.har文件解析备忘


hadoop - 02 ( hdfs 使用与原理 )


第五天 -- Kafka


Hive1.2.2 环境安装


Java 普通 kafka producer API, v0.8.2 是一个分水岭


eclipse通过jdbc连接hive


Hadoop笔记 HDFS(一)


hbase 表重命名


Hive到底是什么


hive多用户模式


解决hive 与hbase 集成报空指针的问题at org.apache.hadoop.net.DNS.reverseDns(DNS.java:92)


Hive --beeline客户端 --常用操作命令 --一些小知识点


hive数据定义


3.4 HDFS集群模式


HIVE CREATE TABLE(一)


Flume的安装配置及使用案例


HIVE元数据


大数据Spark “蘑菇云”行动第107课:Hive源码大师之路第五步:Hive中一切Operator皆是函数的内幕及Hive中Optimizer优化


Hive表导入Elasticsearch


Hadoop 1.0 体系结构


Hadoop2.7.2之Hive-2.1.1的Hiveserver2服务和beeline远程调试


Hive 操作笔记


hbase.mapred.TableMapReduceUtil.initCredentials


Hive 简介


hadoop getfile exercise


Hive安装、配置,HQL,实践


Spark读取与写入文件


hadoop 错误


Flume集群的的配置


【Hadoop】Hive搭建


HBase入门篇(转)


Flume 安装及配置


Hive安装Version2.1.0


sparkSQL


Spring-Kafka(一)—— Kafka,你好


脚本判断hdfs上的文件是否存在


hive 线上调试策略


转-Hive QL——深入浅出学Hive


hive利用hbase实现更新


Hive 1.2.1 UI(HWI)配置


hive中group by 提示Expression Not In Group By Key的解决办法


《转》Hbase shell


Hive的数据存储模式


Hadoop资源感知调度器


Hive_5. Hive QL -- Hive 查询优化


hadoop文档集合


Hive总结篇及Hive的优化


Hadoop生态之数据库HBase的本地安装、基本操作以及Hbase JAVA API


HQL和SQL的区别


hive学习笔记之-使用Sqoop把Oracle表导入Hive


Flume 1.7.0 新特性 - Taildir Source


Hive的数据类型、DDL和DML


Hive 基础介绍


Hive - 创建Index失败,原因暂未知


数据仓库(九)---hive的性能优化---hive索引机制和原理


Parquet 笔记


Spark SQL与Hive的关系


flume采集日志到HDFS中再导入到hive表中


flume接收kafka source落地本地


HiveJDBCInterface Integration with Pentaho or SQuirrel SQL Client


spark 的shuffle流程框架以及源码详解(匠心巨作)(1)


Hive 7、Hive 的内表、外表、分区


hive 字段类型


系统学习hive programming,第二章---使用Hive CLI命令


大数据之:Hive安装详解


Ranger错误:Unable to connect to Hive Thrift Server instance..


HIVE排序函数大小写敏感


基于普通java和基于spring boot的 Java kafka producer and client demo


hadoop tips1


hbase官方文档中文版


Hadoop学习三十一:Win7下HBase与MapReduce集成时XXX.jar is not a valid DFS filename


HBase 入门指南


hive部分:hive表中加载数据的方式(四种)


Spark Streaming + Flume Integration Guide


cloudera mamager中配置hive加载第三方JAR.,为甚beeline不好用?


大数据--》》flume下


初识Hadoop 之 HDFS 及安装【持续更新中......】


Hive使用


PySpark学习笔记(4)——MLlib和ML介绍


Hive初学笔记(一) ---hive环境搭建与安装


hbase 移植数据


Hadoop生态圈介绍


Spark 学习入门教程


hadoop 学习(1) hbase安装运行


hadoop搭建hive web 界面


hbase 1.2.6 集群模式


spark学习-spark安装和启动


spark 连接openfire服务器报错:Certificate hostname verification failed Spark 或者 unable to verify certificate


HDFS(四)——使用 HDFS 的 JavaAPI


Hadoop实战(高清完整版)pdf


kafka集群Broker端参数设置及调优准则建议-kafka 商业环境实战


探秘Hadoop生态10:Spark架构解析以及流式计算原理


spark内核揭秘-01-spark内核核心术语解析


hive DDL语法汇总


MongoDB on Spark的参数优化


cdh - 端口开发大全


Hive基础2笔记


HDFS读写 DataNode NameNode


13.1 hadoop


hive与hbase的区别


kafka2.9.2的伪分布式集群安装和demo(java api)测试


HBase 官方文档0.97.0


kafka之二 文件存储


我的博客目录


spark2.0 翻译:Quick Start 快速开始


Spark基础之--启动local与standalone模式


20180915_Hive


美团曾林西:Spark在美团的应用实践-CSDN公开课-专题视频课程


Kafka系列 —— 入门及应用场景 & 部署 & 简单测试


关于hadoop2.4.1报错的问题


Spark1.X视频教程完整版下载


_00016 Flume的体系结构介绍以及Flume入门案例(往HDFS上传数据)


Hive详解


Welcome to Apache™ Hadoop®!


黑猴子的家:HBase 官方HBase-MapReduce案列一


How to spread receivers over worker hosts in Spark streaming - draft


Spark架构与作业执行流程简介


hbase shell 命令一


Stabilizing a Large HBase Cluster


Hbase 安装部署


spark on yarn的那些事


17.Scala中包、类、对象、成员、伴生类、伴生对象访问权限实战彻底详解


大数据Spark “蘑菇云”行动第103课:Hive源码大师之路第一步:Hive源码思考和解析初体验


Hive编码问题


Chukwa 在hdfs上的存储结构


spark内核揭秘-06-TaskSceduler启动源码解析初体验


置顶贴


Hive内嵌模式安装(基于Hadoop)


Hive 与 数据库比较


Spark的那些外部框架


Hbase 学习笔记二 》HBase and MapReduce


HBase实战 2.2.3 背景知识: HBase写路径


第43课:Spark Streaming中UI内幕实现彻底解密


Hadoop 相关命令说明


使用CopyTable工具方法在线备份HBase表


Hive-3-Hive架构


Hive的三种启动方式及用途


Hadoop Job的提交


启动HIVE


201611月课程day14的Spark问题


数据基础---Spark SQL 中的结构化数据


Hadoop入门实践之从WordCount程序说起


Hadoop Federation + HA 搭建(三) – wordCount测试


2.5 WordContent简单应用


Spark MLLib简介


Homework - HBase Shell, Java Client and MapReduce Job


Hive四种数据导入方式


HIVE + HBASE mapreduce效率问题


Hadoop Node II


hbase数据查询及过滤器详细使用


升级hadoop


Spark2.2.0集群构建方法


Dstream DstreamGraph详解


Spark疑问1之如何查看sparkContext没有关闭的sc


Kafka The Definitive Guide


hive 分析nginx的access.log日志


Apache Hive 0.11 版本分析


大数据项目实战之 --- 某购物平台商品实时推荐系统(四)


Hadoop集群搭建常用命令、目录及注意


3.5 HDFS基本命令


Spark Streaming之运行架构


kafka架构原理和安装部署


hive脚本的执行方式大致有三种


Kafka Design


flex MX Spark


学习Hadoop第三十一课(hive基础及分区表)


Apache Spark Performance Tuning – Degree of Parallelism - spark 性能调优之partition


第7课:spark机器学习第7课:spark机器学习内幕剖析


Flume 的配置


HDFS相关概念


spark内核揭秘-13-Worker中Executor启动过程源码分析


Hadoop的运行痕迹


Hadoop系列--Hadoop再安装


Hadoop应用案例分析


Spark On YARN自动调整Executor数量配置 - Dynamic Resource Allocation


hadoop的配置安装


Spark Sql orderby排序使用测试


spark sql 1.2.0 测试


一些关于Hive的资料


Kafka实战-Flume到Kafka


hdfs datanode 启动失败


Hive on Spark配置


HIVE JDBC


HDFS+MapReduce+Hive+HBase十分钟快速入门(二)


3-hadoop命令


Spark SQL-1-CLI方式


Hive(一) - 初识Hive


Java API 与HBase交互实例


HBASE中无数据


Spark Streaming 数据清理机制


Spark学习笔记(31)Kafka原理内幕和集群构建与测试实战


Hbase Thrift集群问题总结(1)


HDFS Snapshots


2.1.0安装Hive--(默认derby数据库)


HBase RowKey与索引设计:技巧与案例分析


第二节:大数据仓库HIVE《01》


hadoop streaming 使用总结


How to force STORE (overwrite) to HDFS in Pig?


hbase笔记1


Hive(二)


基于Hadoop搭建Hbase集群


Hadoop2.7集群环境搭建


hadoop单节点的配置


Hadoop:启动与停止命令


Phoenix4.6适配CDH5.4


kafka单机版安装测试


搭建spark完全分布式


spark点点滴滴 —— spark streaming+kafka流式计算实战


苏先生之大数据面试经验总结(一)


ubuntu14.04安装hadoop2.7.1


Spark源代码编译生成错误解决方案


Spark的39个机器学习库-英文


hive on spark下运行sparkSql


spark on yarn 的安装


在 Spark DataFrame 中使用Time Window


Hbase的基本shell操作


Cris 玩转大数据系列之日志收集神器 Flume


第1.1章 hadoop之hadoop2集群(一)环境准备


HDFS报错:Connection refused!


SparkSql ----DataFrame


【Hive自定义UDF函数】 与 【hive字符串函数】


HIVE元数据库改为mysql


spark on yarn 出现的问题【测试wordcount程序遇到的错误,ipc.client连接到yarn的端口失败】


Hive总结(七)Hive四种数据导入方式


hive的java客户端


大数据学习笔记历程


hadoop经典系列(二)hadoop常用命令初步


大数据IMF传奇行动绝密课程第73课:Spark SQL Thrift Server实战


【Spark】Spark 简单介绍


Kafka学习之一 :安装启动


HBase介绍


hive常用资料整理


Hadoop学习-安装


“戏”说spark---spark 内存管理详解


flume搜集数据到hadoop HA可能出现的问题及解决办法


CaffeOnSpark 安装笔记 可以正常运行


SparkSQL与Hive的应用关系


HBase实战(5):Spark SQL+Hive +HBASE 使用Spark 操作分布式集群HBASE


hbase数据库错误总结


hive优化


Hive----【DDL操作、对数据表的操作】


hive3:hive和关系型数据库RDBMS的异同


Hadoop架构——云计算的具体实现


hive基础


kafka基本特性简介


第123课:Spark Streaming性能优化:通过Spark Streaming发现botnet及性能优化


tried to access method com.google.common.base.Stopwatch.()V from class org.apache.hadoop.ma...


Spark Release 1.4.0


hive2.0单机、伪分布搭建


hive启动报错,找不到spark的jar包们


hive over hbase方式将微博用户数据导入hbase


spark之13:提交应用的方法(spark-submit)


Flume搭建测试


hive和hbase整合


Hive学习笔记


Spark基本工作原理与RDD


Hive vs RDBMS[笔记3]


Spark零基础学习路线指导


kafka集群操作指南


windows下 eclipse for scala+spark+mongodb


spark(3)-wordcount原理解析


HBase client访问表过程分析


hadoop端口


spark文档学习1 Spark Streaming Programming Guide


Apache Kafka入门教程轻松学-序篇


Kafka的副本策略——《Learning Apache Kafka》学习笔记(原书第三章第4节)


Spark性能测试工具


flume日志报错,同时没能正常收集相关日志文件


Hadoop源码分析(1)————MapReduce之整体流程分析


大数据SQL执行工具调研总结


ClusterId read in ZooKeeper is null


HBase简介(转载)


阿里腾讯云 hadoop+spark集群搭建(2)


Spark基本原理概念 以及 spark streaming 核心原理及实践


Hadoop客户端的命令别名配置


flume+kafka+spark streaming(持续更新)


Hadoop生态圈开源项目总结


5.启动spark-shell


hadoop整体体系规划总结


hive加载公用库


javaAPI操作hdfs文件系统环境准备


Apache HBase 0.94 is now released


spark sql基本使用方法介绍


hive的脚本执行


spark笔记之Scala编程的学习目标


spark sql根本使用方法介绍


HBase执行命令方法总结


第四次实验:树莓派下安装flume-1.6.0


HBase 查找版本号


通过案例对SparkStreaming 透彻理解三板斧之一:解密SparkStreaming另类实验


HBase集群搭建


Kafka学习笔记1:概念


HBase客户端API-表管理


初识Hive


Hive关联HBase


两步实现spark集群


Spark Streaming 实战案例(一)


如何安装spark


ubuntu12.04集群安装Spark


HBase基础架构


hbase基本概念和hbase shell常用命令用法


flume-ng 与elasticsearch整合


Hbase配置项粗解(1)


hadoop fs 命令,安全模式退出


Hive 远程Debug


Hive的简单分布式安装


【转载】Impala和Hive的关系(详解)


hive集成hbase笔记


Kafka项目实战-用户日志上报实时统计之应用概述


Spark Streaming运行原理


Hive学习之路 (二十)Hive 执行过程实例分析


HBase术语及数据模型


hbase 架构


Hbase 之shell命令(二)


经典Hadoop家族系列文章


Hbase--Quick Start


kafka connect,将数据批量写到hdfs完整过程


1、flume安装


初识Kafka


kafka笔记_01_知识点


java实现对HDFS增删改查(CRUD)等操作


Phoenix Hbase springjdbc整合


安装配置flume


hbase数据库安装


Hbase快速单机部署和伪分布式部署,完全分布式部署


Kafka Manager的使用


hdfs笔记


hbase自带压力测试


spark中application、driver、job、stage的理解


hadoop + hbase环境安装配置


HBase安装(1.2.6版)【一篇就够】


Yahoo! 的新一代大数据技术架构解析


高并发架构实战(九) Spring Boot集Kafka


Hadoop+Hbase+Spark集群配置-Spark HA安装


hadoop系列之五JavaAPI操作HDFS文本系统


hbase创建表抛出TableExist异常


kafka分布式消息队列介绍以及集群安装


大数据Hive系列之Hive数据仓库部署


Flume官方文档翻译之(四)


Spark Streaming实时流处理项目实战笔记


云计算


测试集群是否搭建成功


Java 对HDFS接口调用


SparkStreaming集成Kafka,读取Kafka中数据,进行数据统计计算


5-1、Spark环境搭建


Hive基础操作


HDFS 入门


日志系统之Flume日志收集


数据挖掘之--------Hadoop


Hive常用SQL命令操作


完全分布式准备工作


集成hbase


Hbase数据迁移


Spark性能相关参数配置及原理


Hadoop-2.6.0伪分布--安装配置hbase


flume入门教程


Kafka集群搭建及生产者消费者案例


大数据平台常用组件端口号


kafka学习之路


Spring Boot集成Kafka


Spark内核架构流程深度剖析


hdfs常用操作


spark的四大核心组件


Spark-概述、目录文件构成、spark shell、SparkUI


Kafka 0.10.0.+zookeeper3.4.8集群搭建、配置,新Client API介绍


hbase安装文档


HDB—PXF访问HBase数据(四)


Kafka原理及应用


五分钟初识Hadoop


Hive和数据库比较


Hive几种数据导入方式


Hadoop中HDFS常用命令


Hbase shell Loading Coprocessors


用PHP写hadoop的mapreduce程序


hdfs源码剖析文件写入过程时序图


HBase java关键API


hbase配置


Hbase入门简介


hive常用查询


Spark机器学习环境搭建


Kafka介绍, kafka主题的副本机制


linux安装flume及问题


2.hive的java客户端


《Hbase权威指南》深入学习hbase架构(3):存储


Spark编程指南V1.4.0(翻译)


SparkStreaming窗口滑动以及拉链实现转化率模型的高阶应用-Spark商业应用实战


hive默认配置文件


hive整合hbase


HDFS java api文件基本操作 CDH-5-11-2


Pig脚本书写时候注意事项


kafka Transaction coordinator


Receiver 分发详解


Hbase基本shell操作


Hive Hbase integration (整合) 出现zk始终连接 localhost:2181


Hadoop-2.7.1集群环境搭建步骤(二)


Flume向HDFS写数据时权限问题及引发的联想


Hadoop技术选型和架构设计


Hive笔记--安装


kafka原理和实践(四)spring-kafka消费者源码


Hive的安装步骤


精通Spark:Spark内核剖析、源码解读、性能优化和商业案例实战


Spark大型项目下的Spark Streaming本质剖析(全面涵盖Spark 2.0的精髓)项目!!!大项目!!!超大型大数据项目!!!


kafka数据保存时间问题与kafka的性能测试


hadoop笔记本


Docker自定义network搭建kafka


在Yarn上运行spark-shell和spark-sql命令行


Hive元数据信息对应MySQL数据库表(转载)


Hadoop在格式化HDFS时,报未知名主机错误UnknownHostException


kafka和flume集成


【大数据学习】之 SQOOP


大数据集群搭建和使用之八——kafka配置和使用


hive的数据类型


流计算---Kafka详解


hbase Fully-distributed搭建


Spark学习体系整理(基础篇、中级篇、高级篇所涉及内容)


(一) spark源码理解之SparkContext


centos7安装Hive


Spark 2.1.1版本中Streaming与Kafka交互的不同


ubuntu下hive-0.8.1配置


HBase增、删、改、查——hbase shell


从源hbase集群中复制出HBase数据库表到本地目录


Spark Streaming Direct Approach (No Receivers) 分析


源hbase集群中复制出HBase


flume的学习一


spark streaming读取kafka示例


Hive 日志


HBase整合Hive问题记录


spark简单操作——map flatmap filter distinct


HBASE的shell使用


Hive2.1.1安装与配置


参考书籍


Hadoop 生态圈各个模块的启动命令 以及 简单配置 的配置要点(CentOS 6.9)


Spark内存管理(4)—— UnifiedMemoryManager分析


重温大数据---Hbase架构进阶


Linux下Kafka环境的搭建


从flume到kafka,日志收集


Kafka介绍


Spark SQL之Catalog API介绍和使用


golang驱动kafka


HBase修改Table压缩格式步骤


HBase 开启GC


Kafka自我总结


Apache Kafka-核心组件和流程-副本管理器-设计-原理(入门教程轻松学)


Kafka 的配置及应用


Apache Spark 之 入门笔记


hive 支持hadoop-0.23.1


spark Standalone


消息中间件架构面面观


Kafka 使用 Zookeeper 做什么?


Flume和Kafka集成错误:Error reading field 'throttle_time_ms'


hive 远程debug


sequenceFile 转换,并导入至hbase中 (图文解说 2017-7-23)


Kafka集群配置---Windows版


Spark踩坑记——Spark Streaming+Kafka


hive升级测试记录


spark(6)-spark RDD(course14)


什么是kafka


SpringBoot框架集成开发


kafka剖析


hive 安装配置


kafka web console安装


hadoop入门理解


hive 0.8运行python脚本问题


Hadoop 、Hbase、zookeeper 集群环境搭建


php写mapreduce程序示例


hbase安装


hive 访问hbase 表


【备忘】Hadoop视频教程资源


hadoop的基本语法


大数据之Kafka内部原理详细介绍


Spark Streaming集成Kafka的两种方式


初识Kafka:构架、生产消费模型以及其他相关概念


kafka介绍总结


第24课:Spark Streaming的Transformation、Action、Input和Output


Hadoop 学习笔记一 基础知识及常用命令


大数据|Spark技术在京东智能供应链预测的应用案例深度剖析


Hive日志调试


Spark算子:RDD行动Action操作(4)–countByKey、foreach、foreachPartition、sortBy


利用hbase api在本地访问并操作服务器的hbase数据库


第32课:Kafka原理内幕和集群构建与测试实战


kafka 系统日志定时清理


flume的sink写入hive表


北京邮电大学《Hadoop大数据处理》课程2014年讲义


Hadoop系列之十:Hadoop配置文件及常用配置参数详解(未完成)


转:CDH5.7Hadoop集群搭建(离线版)


使用Docker运行spark


彷徨 | HDFS核心设计思想图


HBase源代码阅读与理解


Kafka Performance Benchmark


Log4j+Flume+HDFS采集日志


hbase 介绍


flume配置记录


hbase基本命令,api操作


hive知识


Spark 1.X DatandaLone伪分布环境搭建


Kafka Topic Partition Replica Assignment实现原理及资源隔离方案


Hbase入门笔记( 二 )-- Hadoop单机环境配置


搭建Spark服务器环境


hive操作


大数据技术之Kafka第1章 Kafka概述


Kafka Stream 类库的使用入门


hadoop基础----hadoop实战(二)-----hadoop操作hdfs---hdfs文件系统常用命令


Spark RDD操作总结


HBase 之HFileOutputFormat


Hbase简绍


Spark于hadoop对比


用flume从日志服务器中实时抽数据的案例


SparkStreaming实战


spark开发环境——PyCharm开发python的spark项目


Flume之旅


Kafka分布式消息队列(二):环境搭建&测试


大数据笔记(二):HBase


IgniteRDD学习笔记(四)在SparkShell上部署测试IgniteRDD


Spark资源调度参数调优深入剖析-Spark商业调优实战


EsgynDB 创建Hive外表


HIVE的常用操作-建库和表-插入数据


SparkSQL-Hive表


HBase ImportTsv导入数据


完全分布式安装Hadoop,Hive,Hbase,Hwi,Zookeeper-500行说明


Spark Streaming-Kafka实例(Python与Java版本)


回顾·网易HBase实践


HBase集群无法读写数据


spark提交任务启动参数调优


Flume hive sink采坑记录


hive安装及绑定mysql


为什么(一)开始写spark后来写Hadoop


Apache Kafka入门教程轻松学-第四章 Kafka核心组件和流程-设计-原理(一)控制器


Spark流处理(WordCount)


第七章:小朱笔记hadoop之源码分析-hdfs分析 第三节:hdfs实现分析


Kafka 生产消费实例


Kafka使用go实现生产者和消费者


kafka整体概念1


HBase配置LZO压缩


Hbase万亿级存储性能优化总结


Sqoop 加载数据到ORC表


Hive HA使用说明及Hive使用HAProxy配置HA(高可用)


Hadoop生态组件之Hive环境搭建--第十讲(hive实战-java连接hive)


hive常用命令


Hive 安装手册


kafka原理和实践(六)总结升华


Sqoop将数据从Mysql导入Hive中


High Availability for the Hadoop Distributed File System (HDFS)


Hive常用的属性配置项


Flume 负载平衡配置(Flume load balancing configuration)和测试


flume部署和使用


Spark源码解读之SparkContext剖析


hadoop资源


Flume1.5.0的安装、部署、简单应用


Spark算子:RDD基本转换操作(7)–zipWithIndex、zipWithUniqueId


Hive 的基本命令


hadoop hdfs JAVA API 基本文件操作


Spark 内存分配规则


hadf的常见命令


HDFS的API


Apache Kafka


Hive 中的日志


Hadoop与root用户配置ssh免密码登录


HBase与Hadoop以及JDK的关系


Spark性能相关参数配置


flume-自定义Sink基本框架


学习笔记 Hadoop是什么?


一、kafka原理、部署安装、常用命令


Big Data Ingestion and streaming product introduction


hadoop博客资源


hbase的架构及设计


adoop上路_15-HBase0.98.0入门


Hive 函数


HDFS Shell


HIVE学习笔记


流式计算Storm和Kafka知识点


kafka技术增强


HIVE简单快速入门——[开端篇]


hive数据导入


receiver分发


Hbase修改表名


《Hive常见问题汇总》


Hbase安装手册


一起hadoop(二) 流写出文件并上传至HDFS


flume hbase sink配置


Kafka集群平滑重启


Spark算子:RDD行动Action操作(3)–aggregate、fold、lookup


Hbase shell 的使用


Spark + kafka集群基本操作


kafka 入门


hive表的DDL操作


本地虚拟机redhat7安装kafka教程第二步----kafka的安装与配置


深入理解HBase的memestore、storeFile(HFile)


HBase基础知识


flumeToKafka


Flume把事件写入多个信宿


spark2.1.0 on yarn with CDH5.8.0 安装实战


spark-streaming入门(三)


架构设计:系统间通信(28)——Kafka及场景应用(中1)


hadoop学习日记四 hive环境搭建


spark sql on hive


Centos7搭建Hadoop 2.X伪分布式环境并运行wordcount MapReduce示例


Hive和数据库的异同


01-天亮大数据系统教程之初识Hadoop


第46课:Spark中的新解析引擎Catalyst源码初探


HDFS基本操作 javaApi


HBASE 安装


Apache Kafka系列之Kafka设计细节


WordCount class not found 和 FileAlreadyExistsException,运行WordCount


flume写入


Spark集群搭建的Hive 0.13搭建完整版


ambari系列--报错问题2


大数据企业学习篇05----flume初识


每天一点hadoop第七篇 HDFS(三)


完全分布式Hadoop集群安装Phoenix


通过NFSv3挂载HDFS到本地目录 -- 2续hdfs-nfs网关解决错误


A master URL must be set in your configuration at org.apache.spark.SparkContext.(SparkContext.


HBase Shell 命令


重温大数据---Hive介绍与填坑配置


puppet 笔记


spark的standalone模式部署


Kafka0.10新特性


大数据学习5——HDFS常用的文件操作命令


Windows和Linux环境搭建kafka服务(二)


Hive 客户端工具


HDFS目录(文件 )权限管理


HUE配置HBase


Flume分析


Spark 2015年回顾:四个大版本更迭、数以百计的改进


docker部署kafka,k8s(helm)部署kafka


Spark自定义排序规则以及SQL高级应用-Spark商业应用实战


Kafka-0.8.0单机配置安装


分布式日志收集框架Flume概述 及 实战案例I


spark 单词计数


Kafka 学习笔记(1)—— Kafka ,JMS 介绍


Spark的四种运行模式(1.2.1)


Kafka 跨集群同步方案——Kafka内置的MirrorMaker工具


Databases in Hive


Hadoop单机环境配置


HBase之——集群数据手动迁移方案


HBase笔记


flume四:flume sink介绍


彷徨 | Hive的SQL--DDL详细操作


SPARK的安装与部署


Wandisco推出Hadoop Console集中管理及部署平台


hbase集群维护总结


Hadoop之Hbase------>Hbase常用命令


HBase 伪分布式搭建(使用外部ZK)


Flume + Kafka + SparkStreaming(2.0)


Flume 1.5.0.1 User Guide


Kafka部署与代码实例


Linux下安装spark集群


Hive深入浅出


Hive shell 常用命令


HBase是什么?为什么要使用HBase?


Kafka相关技术文档


Hbase底层原理浅析


Spark 介绍


Spark搭建及第一个Spark程序


分布式文件系统:HDFS(5)


windows 7 python spark环境搭建笔记(待续)


HBase数据模型特性及表设计思路


unbuntu下安装伪分布式Hbase


Spark学习笔记(10)—— wordcount 执行流程分析


oozie框架案例之多Action执行


Hive安装及基础知识总结


hive入门学习线路指导


流式计算基础-1-3


初识Marp(二)——MapR standbox for Hadoop


apache flume collector 安装


hbase shell


bulk-load装载hdfs数据到hbase小结


hbase 下mapreduce 读取hbase中数据


hadoop rename


Spark DataFrame vector 类型存储到Hive表


CDH 5.15.0 hue 4.x 无法认证hbase thrift server


hive 表的分区


大数据之:Flume安装详解


Flume_Flume_flume 简介


Hbase的存储 Rowkey设计


Hive整合HBase完整笔记(亲测)


Hive自定义函数


hadoop 自学指南八之Hive(1)


hadoop学习笔记(HDFS的文件操作)


hive on spark 编译


Flume概述


HDFS一 HDFS的shell操作


hadoop参考资料


hadoop的安装


hive-0.12.0安装与配置


hive使用技巧(三)——巧用group by实现去重统计


来,我教你spark


Hive部分:hive的架构【图片+文字说明】


Spark定制班第6课:Spark Streaming源码解读之Job动态生成和深度思考


Spark集群


hbase数据库详解


hdfs命令


【Spark】Spark应用执行机制


架构设计:系统间通信(29)——Kafka及场景应用(中2)


Flume安装及简单部署


HDFS存储原理


kafka中的配额管理(限速)机制


windows上使用eclipse远程连接hadoop进行程序开发没有权限访问问题


HBase入门教程


kafka安装及删除Topic


spark从入门到放弃四十五:Spark Streaming(5)详解StreamingContext


查看hive的版本


消息系统kafka之二 kafka的HA(高可用)


Apache Kafka监控之Kafka Web Console


Apache Spark Jobs 性能调优(一)


Flume学习进阶(一):source、channel、sink、processor、interceptor等组件列表说明及包含的类型介绍


Flume的介绍与安装


Spark 函数解析


Structured Streaming集成Kafka《官方文档翻译》


spark内核源码深度剖析


《走进大数据之Hive入门》学习笔记(1)


Flume Ng 学习笔记(一)简介


Flume学习的思维导图


HBase分布式集群部署


Hadoop Zookeeper HBase 启动后进程


Hive编程指南学习笔记-1


Spark SQL 数据源 API:Spark平台的统一数据接入


Spring集成Kafka之spring-kafka


第24天: order by 使用详解


Flume学习8_Flume1.5.0入门:安装、部署、及flume的案例


Hbase shell命令


Hive环境部署


Hive的访问接口


分布式数据库HBase


HDFS命令行操作


Hadoop The Definitive Guide 4th Editon


Hadoop安装


Phoenix实现用SQL查询HBase


beeline通过HiveServer2访问Hive的配置和操作


spark 入门、深入学习书籍pdf-2017最强大礼包(精选当当Top10)


Hadoop初学者应该要注意的Hadoop核心知识


Hadoop基础教程-第4章 HDFS的Java API(4.4 Windows+Eclipse+HDFS快速入门)


SparkStreaming整合Flume-Push方式


【hive 安装】Hive1.2.1_HA集群部署安装


大数据Spark企业级实战版【学习笔记】-----Spark Streaming 的构架


配置hiveserver2访问hive


HBase专题介绍 1


HDFS架构( HDFS Architecture)


Hadoop之HDFS


hbase收集


kafka connect+debezium(binlog),解析binlog至kafka


《Hadoop 2.x HDFS源码剖析》2 — HDFS 通信协议


Flume之监控


Hadoop上传文件到hdfs中


Spark学习之基础相关组件(1)


spark概述


【Apache Kafka】设计理念浅析


大数据学习笔记(hive简介)


实战:在Java Web 项目中使用HBase


宿主机程序访问虚拟机HDFS


HBase集群安装-3 HBase安装


Hadoop中的HDFS学习


Spark认识&环境搭建&运行第一个Spark程序


什么是hive


Hadoop基本命令


Hive 随谈(一)– Hive 入门


Linux安装Spark集群(CentOS7+Spark2.1.1+Hadoop2.8.0)


大数据之路-Hadoop-4-hadoop shell 命令基本操作


Hive安装配置使用及java api调用


hdfs的shell


大数据系列之实时计算Spark(七)SparkSQL介绍


Flume与Kafka整合案例详解


HDFS常用Shell命令和基础编程开发


Hadoop(八)flume配置


hadoop2.7文档翻译第二天


hadoop远程客户端安装配置、多用户权限配置


日志采集框架Flume以及Flume的安装部署(一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统)


Apache Spark大数据分析入门(一)


Hadoop实战-中高级部分 之 HDFS原理 架构和副本机制


centos7安装kafka2.11


kafka Address already in use


kafka connector


Flume学习笔记(一) Flume概览与架构


HDFS和hbase


MapReduce程序的工作过程


Spark java程序入门(一)初始化spark


Spark中文手册8:spark GraphX编程指南(1)


Spark学习笔记总结-超级经典总结


hadoop命令 -- job相关


spark 内存管理详解 及 性能调优


使用flume问题总结1——搭建flume+测试Syslog source


HBase--NoSQL的数据库产品


Spark On YARN


hbase 基本命令


【备忘】Spark MLlib 机器学习算法与源码解析


Linux命令操作HDFS文件系统


开发Kafka通用数据平台中间件


HDFS结构


Spark性能优化:开发调优篇


Start Hbase


Task粒度的缓存聚合排序结构AppendOnlyMap详细剖析-Spark商业环境实战


spark笔记之Spark Streaming原理


大数据Big-data相关技术


HBase入门-Java操作HBase


Hadoop HDFS本地存储目录结构解析


Hbase配置项粗解


hbase-shell + hbase的java api


Flume环境部署和配置详解及案例(转)


Hadoop实战-中高级部分 之 Hadoop MapReduce高级编程


Hive:用Java代码通过JDBC连接Hiveserver


Kafka 设计与原理详解


ReceiverTracker 启动过程及接收器 receiver RDD 任务提交机制源码剖析-Spark商业环境实战


Flume 基础知识


Hadoop与MPP解析


Hive的两种操作模式


Kafka、Morphline、Hive的配合使用过滤并格式化日志数据


sparkSql入门1


大数据学习笔记-------------------(6)


编写Java程序访问Spark环境


CentOS7环境下搭建flume


Flume日志收集


HBase快照(Snapshot)技术


使用flume问题总结2——flume event的简单理解


开源大数据周刊-第46期


1001-HBase基本概念


HDFS入门详解(二)


hbase 基础


kafka源码解析之十OffsetManager


使用flume将avro文件上传到hdfs上


Hadoop常用命令


Hive-Based Registry使用


flume大全,,,配置和相关实例


headoop学习书籍


用 Hadoop 进行分布式并行编程(四)Java远程调用Hadoop服务


hbase shell常用命令


hive 加载数据后在HDFS上的文件及其整合


kafka监控及管理


大数据技术之Hive 第1章 Hive基本概念


spark sql和DataFrame本质


ubuntu12.04 hadoop单机模式和伪分布模式搭建


大数据学习笔记之spark及spark streaming----快速通用计算引擎


第23天: Group by使用详解


Flume与Elasticsearch整合


HDFS Java代码进行增删改查


Hadoop3-HDFS的java客户端编写


Java 主流开源工具


Spark SQL演示与分布式SQL查询引擎


cool-2018-10-22-centos7-hive-1.2集群+整合hbase-1.1.3集群


单机节点Kafka配置SASL用户名密码认证


Apache Spark学习:利用Eclipse构建Spark集成开发环境


Flume 1.7.0安装与实例


HBase相关文章索引(1)


hive 资料汇总


一个菜鸡学习者角度去看《HDFS原理》


大数据系列之日志采集Flume(一)Flume简介,架构组成与工作流程,安装


探秘Hadoop生态6:Hive技术初探与实践入门


本地开发spark代码上传spark集群服务并运行(基于spark官网文档)


重新格式化HDFS的方法


Flume-原理解析


HDFS 文件操作


Spark-submit方式提交spark任务


flume OG VS flume NG


hadoop 集群运行WordCount示例程序


hbase(二)--常用hbase shell


kafka生产者


Flume - 初用Flume 1.8.0


Flume HDFS Sink使用及源码分析


Spark调研笔记第2篇 - 如何通过Spark客户端向Spark提交任务


flume采集日志到hadoop存储


第16天: 增加分区、删除分析、加载数据到指定分区讲解和案例操作


44:Spark Streaming之Spark内核回顾思考


Hadoop数据存储


Spark RDD API 参考示例(六)


kafka-proxy的设计


HBase shell 简单使用


StreamingPro


flume同kafka的对接


hadoop---(1)hadoop核心知识点总结


Hive通过JavaAPI操作


HBase 2.x 简单常用命令+示例


Hadoop入门简要学习指南(1)


hive函数总结


hive数据类型


LinkedIn开源Kafka Monitor


flume自定义Serializer收集日志入elasticsearch


spark sql 入门详解


大数据(七) - Flume


大数据Spark实战高手之路职业学习路线图


大数据系列第七课:RDD于Spark运行机制


Apache Kafka编程入门指南:Producer


Flume(NG)架构设计要点及配置实践


Hadoop集群安装及验证


spark streaming


spark源码action系列-foreach与foreachPartition


安装kafka


第一章 启动 flume


HDFS挂载到本地硬盘


HDFS笔记


Hadoop格式化namenode失败


Hbase 安装配置时HMaster启动后宕机的解决方法


Hbase配置指南


eclipse搭建hadoop开发环境


hadoop之MR Job案例


spark原理及java编程模型


Flume 1.8.0 介绍以及配置


Flume笔记整理


Hadoop hive表基本操作


Hadoop之图解MapReduce与WordCount示例分析


Hadoop笔记:HDFS文件读写流程详解


flume 笔记


flume监控


网易王健宗:革命Hadoop,Spark带来百亿市场价值!


hbase建表命令


(转)HBase技术介绍


SparkCore编程(一)-分组取topN


一、Hadoop2.6.0 单机模式配置


格式和启动hadoop ha


腾讯云Kafka海量服务自动化运营实践


2-2.HDFS的shell操作(Hadoop系列day02)


Apache Flume 分布式日志收集系统学习


Spark -9:Spark SQL, DataFrames and Datasets 编程指南


flume学习(一):log4j直接输出日志到flume


flume架构及应用介绍


kafka初识


了解 spark


基于CentOS 7 的OpenTSDB部署与使用——HBase的安装


Hive 操作 HBase


KAFKA 与 FLUME 集成配置测试


hadoop单机版搭建过程


hive优化2


黑猴子的家:Hive和数据库(RDBMS )比较


Spark ShuffleManager内存缓冲器UnsafeShuffleWriter设计思路剖析-Spark商业环境实战


hadoop 文档:Hadoop开发者下载


how-to-use-grahite-and-grafana-to-monitor-spark


单机版kafka安装


对hadoop的一些命令总结


HBASE table导出到文件的方法


HBase数据备份和恢复


Hadoop完全分布式安装Hive


Hbase Shell常用命令--附实例


Spark Streaming的基本思路和基本架构


hadoop-2.7+hive-2.1.1+mysql 集群配置


spark笔记


HDFS命令笔记


Hadoop 之 HDFS操作


Hadoop-HBase 单机部署


Hive与HBase整合


KAFKA知识(基本组成)


MapReduce模拟实现好友推荐系统


hbase常用的shell命令例子


大数据基础知识学习-----Hive学习笔记(一)概述


Flume介绍


【五】Spark SQL中HiveContext的使用(操作hive中的表)(提交到服务器上执行)(Hadoop HA)


HBase 常用命令


HDFS的java操作


Hadoop学习笔记(安装--中篇)


Kafka 安装部署&java demo


Spark学习-周志湖Spark系列


hadoop环境安装


Apache中组件的日志文件重建


Hbase RegionServer 在集群内部不同组之间移动


Spark组件介绍


kafka权威指南中文版之三


spark-shell 基础操作(持续更新)


一篇介绍Hive的论文


hbase shell命令的使用


kafka单机重启topic丢失问题排查


大数据IMF传奇行动绝密课程第28课:Spark天堂之门


操作Hadoop集群


HDFS 原理、架构与特性介绍--转载


Hadoop配置使用Solr


Hbase1.2.5 hadoop2.7.3 importsv实例


Hbase学习(三)shell操作


Spark学习一


hadoop 参数配置


hive01入门


二。spark相关Rdd


HBase集群搭建1Master、2Slaves


flume总结


hbase--Hbase 建表基本命令总结


hive的参数配置方式


『 Spark 』5. 不能错过的 spark 学习资源


第88讲:Spark Streaming从Flume Poll数据


Hadoop—HDFS的Java客户端编程


Hadoop(1)入门


Hadop经典例子WordCount


ccah-500 第30题 Which command does Hadoop offer to discover missing or corrupt HDFS data


hadoop创建文件夹及将本地文件移动到hdfs中


HDFS高可靠性分布式存储系统解决方案


Hive概述纲要、环境配置以及HQL使用


关于GCC4.8.2编译器同时链接rdkafka的c库和c++库时出现的一个BUG


大数据技术原理与应用入门(二)


Hadoop脚本——Hadoop实战初级部分学习笔记


apache kafka监控系列-kafka-web-console


推荐BIG DATA Spark 的7本学习电子书籍(大牛专区)


hadoop分析 - HDFS上传文件


sparkStreaming集成Kafka


spark(2)-入门spark之java maven wordcount实验


欢迎使用CSDN-markdown编辑器


Flume日志收集分层架构应用实践


HBase客户端Java API使用总结


Online HBase Backups with CopyTable


SparkSql集成hive访问hbase


kafka重新分配partition


HDFS java操作(一)FileSystem 常用操作


Hadoop实战---安装


Spark Streaming 第一部分


centos7 安装hadoop:伪分布式配置、全分布模式配置


flume 1.7在windows下的安装与运行


flume的安装和简单使用


hadoop 官方文档


sqoop 之——小案例


CentOS7安装hadoop2.7.3


Hadoop分布式安装03


Hadoop单机版安装步骤


flume log4j


hadoop2.7.2完全分布式环境搭建


mac 安装kafaka


大数据分析工具:Hive、Pig和Impala的区别!


实战 - hive 数据库SQL操作


熟悉kafka


Flume初始篇之flume安装及简单测试


Flume学习4_CentOS6.5下,Flume安装及配置详细教程-存疑版


HBase 数据模型


Hadoop 常用命令


Flume安装及配置介绍


HDFS(二)——HDFS 常用命令


Hbase 源码分析四 - Get 流程及rpc原理


Ubuntu下搭建Hadoop伪分布式


hbase中的master启动后自动关闭


hive tutorial


大数据学习6:HDFS的一些理解


CentOS 7 环境搭建kafka集群


FLUME 小结


Flume相关文档


Hbase 表重命名--利用HBase Snapshots实现表重命名操作


Spark Structed Streaming的一些主要特性及与Spark Streaming之间的对比


kafka学习一:入门


kafka集群监控之KafkaOffsetMonitor 0.4.1版本 以及用sbt编译KafkaOffsetMonitor


【hadoop】Hadoop学习笔记(七):使用distcp并行拷贝大数据文件


8.HBase_应用_集成Hive


Flume架构、Flume工作原理、Flume应用场景


Kafka教程(二)---------------Kafka架构初识


flume之avro实践


hive深入资料


“戏”说Spark---Spark初认识


大数据----【HDFS】


9. kafka shell脚本用法详解


Hadoop启动Yarn


Hadoop版本选择探讨


Hive安装配置


Kafka(二)Kafka Connector与Debezium


Spark2.x 入门:Spark Streaming 简介


Spark入门基础--简介及环境搭建-CSDN公开课-专题视频课程


flume 参考文档 (三)


kafka介绍


Ubuntu 12.04搭建hadoop单机版环境


CDH 的Kerberos认证配置


Spark与Scala学习


hbase shell 中的常用的一些命令


初谈Kafka


001-Hive官方文档


CDH5.14.X安装Kafka过程(Kafka版本选择的过程)


kafka安装


HBase源码阅读-1-脚本


Hbase学习笔记


MongoDB与Spark整合的环境搭建


spark的组件


伪分布式部署(VM9+Centos7+Hadoop1.0.4)五


大数据集群搭建(8)——Flume的单节点安装及使用


征服flume之一——flume-NG的编译


(二)Hive安装


Hive-mysql存储元数据


Kafka实战-简单示例,API介绍


Kafka概述


SparkSql使用内部集成hive访问hbase


flume-ng安装


kafka详解一


Flume OG和Flume NG的区别


Flume框架及应用


flume基础安装配置和实例的学习连接


Apache Kafka系列(一)----简介


Kafka安装配置(集群模式)


【Flume】【源码分析】从入口Application来分析Flume的启动过程


大数据Spark “蘑菇云”行动第33课:Spark架构剖析


HIVE—索引、分区和分桶的区别


Kafka 0.9.0 Documentation


flume读取log日志文件存储到HDFS


hdfs的shell命令


分布式消息队列kafka原理简介


大数据系列第五课:scala基础


flume 日志收集单节点


log4j结合flume完成日志收集并保存到hdfs上


大数据-Hadoop 伪分布式配置(已配置成功)


apache flume基础应用


Hbase 简单操作Java示例


hadoop2.7.1 在Ubuntu 32位 上安装单机版伪分布环境


hive基本操作


在Ubuntu下创建hadoop组和hadoop用户


获取日志数据的方法和系统


Eclipse中操作Hive、HDFS时的jar包列表


Spark资料


hadoop系列之HDFS 原理与实战


大数据之--Hadoop概述


Flume内置channel,source,sink三组件介绍


Kafka Mirror Maker Best Practices


hive on spark的安装实现


wordcount程序运行,路径问题


大数据学习1——大数据及Hadoop概述


Docker 搭建Spark_hadoop集群


Hadoop2.7.2之集群搭建(单机)


Kafka的分布式架构设计


SparkStreaming数据源Flume实际案例分享


flume篇


logstash读取kafka数据插件


创建hadoop用户和实现SSH无密码登录


Hbase笔记5


Ubuntu17.0下安装Hadoop


hadoop fs -put


kafka的高可用和一致性探究


【Hbase】跨集群拷贝表


HDFS集群启动、YARN集群、简单操作演示


Kafka 基本知识及常用命令


Spark Stream 实战


Spark概述-------学习笔记


查看集群中hive的版本


深入浅出学Hive——初始Hive


Hadoop学习笔记(六)(Spark + Flink + Beam)


Hive 用户指南


Hive的使用之控制台


SparkStreaming案例详解


flume简介(一)


hadoop安装配置中的权限管理


kafka 查看topic消费


Hive授权(Security配置)


PyCharm一些使用参考笔记


hadoop组件书籍列表


python连接hive的demo


记一次hbase删除表失败后导致hbase master挂掉并启动不来


Hadoop在虚拟机简单的集群


Spark项目之环境搭建(单机)二 hive-2.3.3安装


hive 配置


HDFS的基本的架构


Hbase编程实践


Spark技术内幕:Master基于ZooKeeper的High Availability(HA)源码实现


Writing from Flume to HDFS


Flume NG:Flume OG 区别对比


HDFS 常用文件操作命令


hadoop集群管理——配置文件


HDFS基本知识:基础命令


HDFS的快照原理和Hbase基于快照的表修复


Hbase2.0.0 集群安装


Hbase单机版测试


flume 收集


【一】HDFS简介


发送数据到Flume


学习Spark(1)


Hadoop资料整理


Hive进行数据抽样-Sampling


Spark基础 -- Spark Shell -- RDD -- 算子


hive体系结构和hive作业形式


HBase运维基础——元数据逆向修复原理


Hbase的常见操作


Kafka负载均衡、Kafka自定义Partition、Kafk文件存储机制


RDD内部解密


sparksql\hive on spark\hive on mr


HBase的简单基础使用


Hbase基础


Python学习笔记——大数据之Spark简介与环境搭建


完全分布式hdfs 路径问题造成


Hadoop学习总结之五:Hadoop的运行痕迹


Hive学习笔记 --- Hive创建分区表


Spark学习笔记(1)——


Spark资料链接汇总


Flume的安装与使用详解


Hadoop实战-中高级部分 之 Hadoop RestFul


Hive 架构


Impala


Linux(Ubuntu)中HDFS的操作(Shell)


系统间通信方式之(Kafka的集群方案介绍结束3)(二十二)


4.1.0HBase的shell命令行操作


HDFS分配策略学笔记二


HDFS架构及源码分析


Hbase之Spark通过BlukLoad的方式批量加载数据到HBase中


Hive与Hbase整合


Linux 用户管理


Linux上传本地文件到Hadoop的HDFS文件系统


大数据学习-hadoop入门


(5)HBase 1.2.6伪分布安装


Hadoop实战-中高级部分 之 Hadoop MapReduce高级编程


flume + elasticSearch + kibana


flume整合kafka


hadoop配置说明


hdfs块丢失导致hbase部分数据获取异常


记一次Kafka不能消费故障


Hadoop生态专辑 —— 总体架构目录


Spark生态和Spark架构


shell命令执行hive脚本(hive交互,hive的shell编程)


初学HBase的几个问题


大数据时代的技术hive:hive介绍


第七天 - HDFS概述、命令操作 - JAVA操作HDFS - 集群间时间同步、手动修复


Kafka研究


Linux搭建Kafka集群


Spark中文手册10:spark部署:提交应用程序及独立部署模式


hadoop基础教程


CentOS 下HBase1.2.6 单机和 伪分布式平台搭建


Hbase听课笔记


kafka基本操作


大数据实习笔记


孙其功陪你学之——基于IDEA使用Spark API开放Spark程序(3)


Apache Kafka 集群环境搭建


Hbase数据库(基本命令)


Spark SQL


hive初探


kafka分区无leader


spark基础知识之 spark RDD


为什么hive中show tables没有表和在mysql中use hive后再show tables却能看见表?


Flume使用案例五


HADOOP:HDFS的核心知识


Hadoop之HDFS上测试创建目录、上传、下载文件


Hive shell 命令。


flume安装使用教程


hadoop bin 目录主要文件说明


hive的介绍


大数据Spark “蘑菇云”行动Hadoop实战速成之路第29课:Hadoop架构详解及Hadoop集群搭建、配置和测试实战


漫游MQ之kafka实战


Spark及其子项目


hbase 读写过程


mac安装hbase伪分布式


windows kafka 安装测试


孙其功陪你学之——spark----搜狗日志文件深入实战


第55课:60分钟内从零起步驾驭Hive实战学习笔记


HDFS概念,HDFS详解


Hadoop笔记:HDFS环境搭建


Hive_表操作


Hive的数据存储格式


Trafodion 查看原生Hive表


flume学习03-flume收集log4j日志


hadoop安装详解


【Hive】命令行提示符中显示当前所在数据库


深入理解HBase的系统架构


Flume学习5_Flume环境部署和配置详解及案例大全


Hive SQL 监控系统 - Hive Falcon


Spark存储体系底层架构剖析-Spark商业环境实战


Spark的运行架构分析(一)之架构概述


spark 环境搭建及几种模式测试


Apache Flume采集数据简单案例


Flume安装部署,采集方案配置文件编写案例,启动agent采集数据


HBase 安装使用


hadoop的起源


什么是Flume


Hive-1.Hive入门介绍


Hive安装和使用


Hive的API操作


Kafka的揭秘


Storm 0.9.3的新特性


flume整合nginx到hdfs


hadoop学习--安装使用


ulimit 设置不生效问题解决


孙其功陪你学之——基于IDEA使用Spark API开放Spark程序(2)


详解hadoop之二:HDFS Federation(联邦)


HDFS基本概念----初识HDFS


Spark在Hadoop用户下启动


Centos_7.2 下构建 Kafka_2.13 分布式消息系统的单机版


Spring Cloud Bus 消息总线集成Kafka


hadoop API


hive的基础语法


spark2


什么是kafka?kafka的安装及使用


07大数据内存计算spark系列贴-spark SQL


HBASE从入门到精通


HIVE 数据定义 DDL


Hadoop之HDFS文件操作


Hive优化及优化实例


Hive学习资料


kafka 学习笔记


kafka-最新实战


spark二次开发eclipse环境搭建


ubuntu下搭建hadoop集群


Centons7下安装配置Kafka、Linux下安装配置Kafka


Hadoop学习之二《Hadoop环境伪分布式环境搭建》


Spark Streaming学习教程


hive cli 常用操作(-e,-f.-i)


hive参数——深入浅出学Hive


hive语法


ubuntu安装hive0.12.0


【课程】Spark从零开始


大数据时代:Kafka 如何做到 1 秒发布百万条消息


理解Hadoop


HBase笔记一:HBase的集群环境配置


Spark Streaming介绍以及简单使用


Spark Streaming详解(重点窗口计算)


flume 读取tcp写到hdfs


flume学习一:flume基础知识


hive(一)--hql摘要


kafka简介


大数据下的日志-flume(二)高并发下的优化


大数据学习路线


Flume0.9X和1.X的区别


Hadoop启动、作业提交及错误修改


Hive执行INSERT overwrite 报错:query returned non-zero code 1


hive-hwi安装


hive报错


【HDFS篇】HDFS的常用的命令操作汇总


【Hadoop】--HDFS介绍


大数据离线--HDFS读写原理介绍


02 初识Hadoop


HADOOP快速入门


Hadoop硬实战之一:使用flume将系统日志文件导入HDFS


Linux系统消息队列框架Kafka单机搭建


python联接hive的模板


大数据学习路线二


维护1


Flume学习笔记及配置参数详解


Flume;里的HDFS上的sink参数配置


Spark Streaming编程讲解


Spark快速入门指南


flume (日志收集系统)


hive中Specified key was too long; max key length is 767 bytes问题解决


(6)hadoop学习——hive的文件存储和基本数据类型


Flume架构与源码分析-核心组件分析-2


Kafka总结(一):Kafka概述


Spark 1.5.2 on yarn升级问题总结


Kafka 订阅发布


Spark编程使用的基本指令


kafka工作原理介绍


1002-将Hive的默认数据库Derby改为MySQL


HBase学习之路 (三)HBase集群Shell操作


Spark-02


Ubuntu下Hive配置(MySQL数据库的安装方式)


flume入门 log4j 输出日志到flume


hive_sql


Flume 整合 Kafka 使用


Hadoop实战(6)_搭建Apache Hadoop的Eclipse开发环境


Hive on oozie以及action间参数传递


Spark 1.5.1客户端安装


如何查看当前hive版本号


深刻理解HDFS工作原理


Hadoop基础教程-第12章 Hive:进阶(12.1 内置函数)(草稿)


Hadoop实战-中高级一部分 之 Hadoop作业调优参数调整及原理


【Flume-1.8.0】Flume概要


安装kafka到window上,编写kafka java客户端连接kafka


当前用户对hadoop安装目录无足够权限


深入浅出Spark


Hive总结(九)Hive体系结构


kafka原理和实践(五)spring-kafka配置详解


Flume 中文入门手册


Kafka Client API 基本使用


Kafka入门经典(官网翻译)


Spark2.1.0——SparkContext概述


Spark的RDD简单操作


【Java】Appache Flume 中文介绍


【Hadoop】NameNode


基于CDH 5.9.1 搭建 Hive on Spark 及相关配置和调优


Hadoop之HDFS工作原理


kafka原理和实践(一)原理:10分钟入门


spark之5:配置文件


Hbase(1)基础篇


Spark简介与优化


hadoop,hbase,zookeeper安装配置


spark 支持native redis Api(精华)


Flume NG 学习笔记(二)单机与集群Flume 配置


Flume概念总结一


HDFS shell 命令


Hadoop v1.1.2安装配置


Hadoop版本


Kafka和flume整合------flume的配置文件


Spark Streaming概述(1)


flume+kafka+storm整合00


hadoop学习笔记之一:初识hadoop


hive cli


搭建kafka开发环境


Hadoop单机(独立)模式的安装与配置


Kafka性能测试方法及Benchmark报告


Kafka架构及应用


spark学习笔记1一20170407


大数据IMF传奇行动绝密课程第55课:60分钟从零起步驾驭Hive实战


大数据基础知识及分布式存储原理


Flume基础学习笔记


Flume的描述和使用


HBase配置项详解


flume 入门初识


hbase基本介绍


【十八掌●武功篇】第十二掌:Flume之工作原理与使用


Flume简介及配置


HBase简介2


Hbase MapReduce例子


KafKa+Zookeeper+Flume部署脚本


HADOOP -hdfs of wordcount


HBase架构图及数据模型


Hive与关系数据库的区别


Ubuntu14.04下单机、伪分布式配置Hadoop2.7.2


flume学习(四):Flume Interceptors的使用


hadoop HDFS URI


HBase表重命名


Streamsets应用--Kafka2ES


hadoop2.6.0 shell 命令


hadoop命令及hive数据库操作语句的简单使用


hive java 的demo


大数据在线分析处理和常用工具


Hadoop-MapReduce


Hive 各版本关键新特性(Key New Feature)介绍


Hive学习(二)基础知识


Mapreduce于HBase集成


Spark一级资源调度Shedule机制及SpreadOut模式源码深入剖析-Spark商业环境实战


Spark学习笔记(合集)


hadoop之hdfs


hive 的一次使用命令


1flume原理


Flume与Kafka整合


Spark 分布式集群配置示例


hadoop命令


kafka系列之安装及初步使用,单节点部署使用(一)


使用confluent本地安装和使用kafka


向Spark开炮:1.6版本问题总结与趟坑


Apache Kafka(一)


HBase的理论性总结


HDFS环境搭建—伪分布式搭建


HDFS的体系结构和操作


Kafka(一)


Spark 定制版:002~Spark Streaming(二)


hadoop提供了一个跑在yarn上的示例,可以运行


hive between Bash 3.1 and 3.2


Flume(NG)架构设计要点及配置实践 Flume NG是一个分布式、可靠、可用的系统,它能够将不同数据源的海量日志数据进行高效收集


Flume学习笔记 --- 模拟流式数据产生数据


Hive代码组织及架构简单介绍


flume总结(安装、简介及常见异常处理)


第13课 spark内核架构解密学习笔记


Flume 1.7 源码分析(三)程序入口


Flume初学习


Hadoop中HDFS的常用命令


Hive编程指南.epub


hadoop,hive常用指令


hadoop学习--hive


hadoop集群配置


大数据Flume_06


Hadoop--05--运行WordCount


hive on spark入门安装(hive2.0、spark1.5)


kafka与zookeeper单机集群搭建


HadoopRDD


Hadoop解决两个问题


flume og 安装及配置


hive udf开发以及永久注册udf函数


WordCount运行笔记


hive问题Cannot get a connection, pool error Could not create a validated object 的解决办法


kafka安装及配置


log4j+flume+kafka+strom整合


可扩展hdfs——HDFS Federation(HDFS 联盟)介绍


大数据学习篇:hadoop深入浅出系列之HDFS(四)——shell操作


CDH-HA


Flume-ng+Kafka+storm的学习笔记


HBase Admin createTable 创建表


Spark学习系列一


hdfs块丢失导致的异常问题排查解决


【大数据】HDFS


Kafka总结(九):KafKa 与Spark整合应用


Spark SQL部分简单使用详解


Spark 概述


Spark-Flume整合--Pull


hive:执行hql脚本


kafka的安装与简单使用


xshell操作hbase及简单的命令分享


hive学习笔记第一篇


kafka + zookeeper 单节点配置


kafka集群搭建


书签 of 技术文章


Hadoop hdfs常用命令


Hadoop原理汇总(一)——HDFS


Hadoop集群(第7期)_Eclipse开发环境设置


Hive总结(二)Hive数据导入的三种方式


JEESZ-kafka集群安装


hbase权限控制


hive学习计划


伪分布式环境搭建之hadoop、Hbase的安装与配置


第51课: Spark中的新解析引擎Catalyst源码SQL最终转化为RDD具体实现


详解hadoop之一:HDFS架构


黑猴子的家:Kafka 工作流程分析


HDFS命令行接口


Spark入门到精通视频学习资料--第七章:Spark多语言编程(1讲)


hdfs异构存储


模拟客户端将数据flume存储在hdfs上


flume-1.8.0在Windows系统中的安装与使用


Flume相关技术汇总


hadoop的集群搭建


日志收集系统Flume调研笔记第2篇 - Flume配置及使用实例


Flume使用namespace操作


Kafka总结(四):Kafka命令操作


mapreduce实例--统计文本中的单词数


第85课:基于HDFS的SparkStreaming案例实战和内幕源码解密


Flume简介及部署、测试


Hbase基本操作


Kafka全解析


Spark Sql介绍


spark之3:安装部署


Flume安装使用


HDFS Federation设计动机与基本原理


Spark RDD API 参考示例(一)


hadoop


kafka spring 实例


kafka安装与测试


【转发】Hadoop HDFS 的 HttpFS


黑猴子的家:HBase Shell 命令


Hive-1-Hive初识


Kafka启动脚本


Spark入门到精通(入门)——第三节 Spark shell


hadoop入门介绍


kafka之三 Kafka 高可用


spark history server学习


有Mysql数据库的情况下为什么要用Hive数据库?


HBase学习笔记


HDFS总结 思维导图


Hadoop小文件的问题


Hdfs 常用命令自己的一些总结


hive cli 常用命令


spark从入门到放弃四十九:Spark Streaming(9)updateStateByKey


spark内存管理模块


HDFS学习总结


JobScheduler job jobset


Hadoop实战-初级部分 之 Hadoop 分布式文件系统1


hive 安装


Flume的下载安装


hdfs简单操作


Flume的Source--KafkaSource


Hive 的安装部署和测试


Spark伪分布式搭建


Spark学习笔记:Spark进阶


【Python3实战Spark大数据分析及调度】Spark SQL 课程笔记


从HDFS拷贝一个表到系统目录生成CSV


设置Flume监听文件内容


Hadoop实战-初级部分 之 Hadoop安装部署


Hadoop集群(第5期)_Hadoop安装配置 1、集群部署介绍 1.1 Hadoop简介   Hadoop是Apache软件基金会旗下的一个开源分布式计算平


Hbase在HDFS上的各个目录


Spark Core面试篇01


hadoop中对hdfs的shell操作--block--配置参数--启动问题


hdfs架构分析与第一个hdfs应用程序


kafka新建主题指定副本分布


spark点点滴滴 —— 认识spark sql的DataFrame和DataSet


大数据离线-HDFS(上)入门操作


Flume安装部署和第一个官方案例


HBase跨集群复制数据的另一种方法


Hadoop原理(HDFS+MR+YARN)


Spark源码分析之-deploy模块


hadoop 视频总结(1) -- 主要是概念


window下Kafka最佳实践


hive 执行命令方式,数据加载


HBase与MapReduce集成


Hadoop生态系统命令合集(更新中……)


Hadoop的基本结构介绍(原创)


Spark1.0.0 运行架构基本概念


spark与shark的安装


ubuntu14.+ 下 Flume+kafka+storm的配置


深入浅出学Hive:Hive高级编程


HBase技术介绍


Hive总结


Spark大数据学习笔记_第5篇_kafka集群环境搭建


Spark的运行架构分析(二)之运行模式详解


hadoop 错误提示 解决范围


秦凯新的技术社区-大数据商业实战系列全集目录


Hbase访问方式之Java API


Hadoop7-HDFS的NameNode的元数据管理机制与Hadoop的高可用架构


Hadoop伪分布安装


Hbase部署


MapReduce并行编程模型和框架


Spark Streaming基于kafka的Direct详解


flume 用户指南 - part 1


hadoop从零开始--HDFS篇


hodoop安装步骤


HBase基于Hadoop2.5完全分布式HA环境搭架


Hbase架构以及应用介绍


hive环境搭建


安装Kafka


远程访问高权限拒绝,加入如下属性


HDFS体系结构简介及优缺点


Hive之 数据存储


Spark Streaming


Spark内存管理机制


hadoop安装


spark分发jar包性能调优


大数据学习笔记-------------------(29)


HDFS Commands


Kafka之简介


Kafka深度解析


pyspark系列--连接pyspark


HBase常用Shell命令和基础开发


Hbase超详细介绍


Hive入门学习之一:Hive的简述与架构


Spark 1.2.0 released


大数据IMF传奇行动绝密课程第21课:从Spark架构中透视Job


查看进程和进程强行干掉命令


Mac上第一个eclipse编译的Hadoop程序


flume使用(四):taildirSource多文件监控实时采集


flume的安装和使用


3.sparkSQL整合Hive


HBase Java简单示例


HDFS HA补充


HDPCD-Java-复习笔记(23)- lab


JDBC 连连Hive报错:Connection reset


Kafka性能key


Linkedin Camus的使用


Spark Streaming和Flume集成指南V1.4.1


Flume安装和使用说明


HBase Write Path


Hadoop MapReduce将HDFS文本数据导入HBase


Hadoop的安装和配置,Hadoop集群搭建


Hive之Java操作jdbc以及脚本实现


Hive集成HBase(一)


hadoop18--JavaAPI, 读写流程, 物理模型


HDFS中心缓存管理


Hadoop 处理小文件


Kafka背景及架构介绍


Spark修炼之道(进阶篇)——Spark入门到精通:第十三节 Spark Streaming—— Spark SQL、DataFrame与Spark Streaming


Spark的简介和在大数据领域的地位


hadoop集群节点暴力删除后,hdfs异常处理


【hadoop】 1009-hdfs的shell命令


Maven java通过jdbc连接Hive 执行HQL语句


Spark 源码阅读一-启动脚本


hive并发调用的运行方式


大数据系列之数据仓库Hive原理


03.分布式文件系统HDFS


Hadoop1.1.2分布式安装


hadoop 基本操作命令


shell定时创建Hive表分区


【二】Flume安装


HBase Shell 操作


HQL执行的三种方式


Hadoop浅见


Spark 从入门到放弃 之 quick start


实现Flume多维度metrics测量的解决方案


淘宝HBASE基础介绍


HDFS常用命令[备忘]


Hadoop命令摘录


Kafka的分布式架构设计与High Availability机制


hadoop学习之使用命令行以及javaAPI管理 hdfs中的数据


常用HQL语句


Flume1.5.0的安装、部署、简单应用(含伪分布式、与hadoop2.2.0、hbase0.96的案例)


Hbase 原理 及其安装


Hive基础使用


hadoop六个配置文件


hive 基本架构


kafka(3) -- 连接导入、导出数据


kafka应用之路


spark源码走读(1)


HBase读写数据流程


Hadoop 解除 "Name node is in safe mode"


Hive知识总结


ccah500 考试大纲翻译


hive注意事项


kafka设计原理以及应用


scala基础20-包使用进阶


HDFS简介


Hive学习笔记 --- Hive的Beeline使用


Kafka简介 & 特性 & 工作流程


Spark常见问题汇总


flume收集日志到mysql


hive系列(1)


大数据入门学习笔记(贰)- 初识Hadoop


Flume-1.7.0的安装和配置


HBase数据导入工具总结


Hadoop之hdfs简介


Spark 调优与调试


Spark的四种运行模式


hive安装、配置 mysql存储元数据


3.如何安装Apache Spark


Docker KafkaOffsetMonitor 0.4.6安装与搭建监控


HBase源代码阅读与理解


MapReduce初体验


HBase API


HBase的安装与基础编程


Hadoop命令大全


hbase数据库---slf4j-log4j12-1.6.4.jar包冲突


Hive笔记二之数据类型,加载方式与hdfs对应关系


Spark Streaming高级特性在NDCG计算实践


flume sqoop kafka使用小结


Flume入门笔记


HBase入门篇2-Java操作HBase例子


HDFS应用场景、原理、基本架构及使用方法概述


Hadoop配置项(core-site.xml)


Mapr 安装hadoop的组件(三)——安装hbase


openTSDB详解之底层HBase表分析


Flume完整实例一:从指定网络端口采集数据输出到控制台


hbase配置详解


kafka 自启


【七】HBase集成Hive(Hive On HBase)


Hive相关资料整理


HBase Shell 常用命令


Kafka设计解析(五): Kafka Consumer设计解析


hadoop组件---数据仓库(二)---hive的数据模型和数据类型


hadoop集群数据迁移


Flume简述和架构


HDFS 读写流程


Hbase shell 命令详解


KOA + egg.js 集成 kafka 消息队列


Spark On YARN部署模式下的内存分配情况


Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法


Spark应用程序开发参数调优深入剖析-Spark商业调优实战


hive学习(转载)


大数据学习笔记-------------------(20_2)


大数据技术之Flume研究摘要(一)


Flume 监控


HDFS的认识和理解


Hadoop入门


Kafka 下载和安装


Spark定制班第1课:通过案例对Spark Streaming透彻理解三板斧之一:解密Spark Streaming另类实验及Spark Streaming本质解析


eclipse 远程Debug Hbase


hadoop文件夹大小统计


在Spark Shell中编写WordCount程序


大数据求索(4):Hive安装和使用


搭建Hive的图形界面


Hadoop - HDFS操作


Hadoop实践(四)---在HDFS中合并文件


Hbase shell的基本操作完整流程


Hbase学习笔记汇总


Kafka-[3]-KafkaStream


O'Reilly精品图书推荐:Spark高级数据分析


Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)


flume入门


spark漫游记之-思维导图系列


缘分天空之我的Kafka入门


跟我学spark1


Flume学习总结


Hadoop v2(Yarn)集群配置(ubuntu 12.04)


Hive-sql基本语法


Spark常用算子详解汇总 : 实战案例、Java版本、Scala版本


kafka集群部署以及java客户端测试


wang-----Flume NG 简介及配置实战


Flume NG使用


Hbase


Kafka监控系统Kafka Eagle剖析


Spark SQL与DataFrame详解以及使用


熟练掌握HDFS的Shell访问


集群使用初步


Hive篇---Hive与Hbase整合


flume安装和avro场景


kafka manager使用教程


在root用户执行hive命令报错


用Python连接HDFS


那些年踏过的Apache Flume之路


hadoop2.0.x【2】--Apache Hadoop MapReduce - Migrating from Apache Hadoop 1.x to Apache Hadoop 2--翻译与分析


spark-高手进阶


苏宁大数据面试题


2016 Spark旧金山峰会侧记


hadoop基础----hadoop理论(三)-----hadoop分布式文件系统HDFS详解


hdfs简单测试


hive desc table乱码问题


《Spark 官方文档》Spark配置


大数据扩展


HBase Shell实例


HIVE Schema Design 模式设计


Mac 安装使用kafka


Flume架构


Spark任务延迟调度及调度池Pool架构剖析-Spark商业环境实战


spark sql on hive初探


第89讲:Spark Streaming on Kafka解析和安装实战


HDFS创建全局快照


Hadoop之HDFS上测试创建目录、上传、下载文件(这些基本操作记录下来,总有忘的时候)


KAFKA知识(Producer)


hadoop2.7.2学习笔记03-hadoop命令


在Ubuntu14.04下安装Hadoop2.4.0 (单机模式)


HBase MapReduce Examples


Hive(一)——安装配置


hive 1.0.1 安装配置 hadoop 2.6.0


spark streaming 获取数据方式


Hadoop学习笔记(一)


Spark SQL从MySQL中加载数据以及将数据写入到mysql中 Spark Shell方式 Spark SQL程序


《Hadoop实战》PDF版电子书下载


从无到有系列之HBase-安装部署01


Flume安装及简单使用


Flume安装部署


Hadoop 命令工具


Hadoop 实战之Streaming(四)


Hadoop集群完全分布式模式环境部署


Spark Checkpoint写操作代码分析


Spark架构


eclise中启动Hbase的Hmaster,玩玩shell


第十一天 - 大数据项目结构 - Hive简介与安装配置、基本操作


HBase 0.90.4 官方文档(中文版)


Spark 1.0.0企业级开发动手:实战世界上第一个Spark 1.0.0课程,涵盖Spark 1.0.0所有的企业级开发技术


Spark Streaming入门


Spark 生态系统组件


大数据时代之hadoop(三):hadoop数据流(生命周期)


Hadoop分布式集群搭建 (一 Centos7 环境准备)


Hadoop学习笔记(二)设置单节点集群


kafka主题


kafka的相关组件介绍


kafka集群管理重要操作指令运维兵书-kafka 商业环境实战


一起学Hive系列文章


大数据===》》》scala基本用法


HDFS中常用到的命令


Hbase 在HDFS上的目录树结构


Spark Streaming实践和优化


flume-ng学习之spooling directory类型source配置深入及解析


hadoop 资料


hadoop 基本操作手册


Hadoop——hdfs原理详解


Hive笔记八:Hive体系结构


Hive错误


hadoop hdfs的一些操作


hive 优化(推荐)


由于在写oozie hive action时候script属性指定hql脚本时多写了一个斜杠导致的一个悲剧,以及解决方案


Kafka快速上手教程 4


kafka stream流式处理


spark 将dataframe 数据写入hive分区表


HDFS快照 | HDFS Snapshots


Hive学习笔记 --- Hive元数据与数据存储


《Spark快速大数据分析》笔记Ch1、2


Flume怎么保证数据传输的完整性


Flume知识点总结


Hive客户端调用的几种方式


Spark整合HBase(自定义HBase DataSource)


SpringBoot成长笔记(四)整合kafka


hadoop&hive常用的命令-备忘


大数据笔记03--高可用的完全分布式HDFS及HDFS操作


Hadoop HDFS常用命令


Spark算子系列文章


flume的安装和实例测试


hive参数调优文章


kafka consumer 停止消费topic


安装kafka rest proxy - 使得我们能通过http访问kafka


Hadoop学习(三) HDFS 基础使用


Spark SQL基础与实践


flume 1.4.0 user guide


hadoop工作原理


hbase java api详解


hdfs 的相关命令


kafka0.8和1.0整合sparkstreaming


关于HDFS


Hadoop命令汇总


Hive的安装


Kafka设计解析:Kafka Consumer解析


hadoop 简单入门与streaming常用配置参数说明


hbase Shell之简单命令说明


Flume NG:Flume 发展史上的第一次革命


Hadoop 2.0底层工作原理


Hbase架构概述


flume+kafka


hadoop环境配置


hbase笔记-----基础


hive中的表、外部表、分区和桶的理解


详解kafka集群搭建


HBase 数据入库(1)-创建链接


HBase分布式数据库基本原理


Hadoop学习笔记——Hadoop常用命令


Hive 练习操作2 文件保存在HDFS , HIVE 数据仓库建表


Kafka设计剖析(一):Kafka背景及架构介绍


hadoop的文件操作


hive 的临时统计库 TempStatsStore


Hadoop----集群运维(持续更新...)


Hbase 导入导出


Kafka设计解析(六)- Kafka高性能架构之道


hadoop安装日记(四):安装和配置hadoop


HDFS总结


Hadoop实战-中高级部分 之 Hadoop 集群安装


Hadoop实战-中高级部分


Yarn产生的历史背景


kafka for mac安装


单机伪分布式环境搭建(配置Hadoop)


HDFS介绍


Hive,Hbase,HDFS等之间的关系


Hbase 基础 (待完善)


spark容错机制


分布式计算框架Hadoop


麻雀虽小


HDFS Python 访问方式


HDFS常用操作


Hbase数据库技术详细讲解


Hello.txt


Kafka学习笔记(一)


Spark SQL 初识1(2.0)


hadoop 命令


大数据之:kafka安装详解


HBase Shell And JavaAPI使用


Hadoop 的简单描述


kafka学习笔记


spark面试题


初学Hadoop(一)


林子雨—大数据技术原理与应用—上机实验三


linux下创建用户、用户组及赋予sudoer权限


分布式日志收集收集系统:Flume


HDFS基础


Hadoop2.x HDFS源码剖析---概述


Spark学习总结


第一章、flume的介绍及原理


Hadoop中HDFS的存储机制


Hbase源码解析和开发实战笔记


hadoop集群安装部署(二)


分布式日志传送工具kafka


HBase系列 1:开发环境搭建


Hbase技术详细学习笔记


hive查询语法


消息队列RabbitMQ和Kafka


Hive 创建dual 表


Hive中对数据库,表的操作


Kafka相关文章索引(1)


hive安装遇到的问题


hive库基础命令


从Hadoop到Spark的架构实践


3.配置hive环境


Hive 文件格式 & Hive操作(外部表、内部表、区、桶、视图、索引、join用法、内置操作符与函数、复合类型、用户自定义函数UDF、查询优化和权限控制)


Kafka学习一


README


kafka学习七:kafka 运维


十四、HBase关闭


Flume简介


HIVE入门


JDBC连接Hive


KAFKA知识(SHELL命令)


spark算子系列文章


Flume-NG启动过程源码分析(1)


Hbase基本概念


Kafka Producer拦截器


图解StreamingContext、DStream、Receiver 第三讲spark streaming


Apache Spark as a Service


Hadoop中的HDFS的存储机制


Hadoop分布式文件系统HDFS——Flume和Sqoop导入数据,distcp并行复制,Hadoop存档


Hive学习1:Hive原理


hive删除表失败


Hadoop & HBase 故障排除


Kafka Java示例


hbase介绍


大数据集群搭建(5)——Hbase的单节点安装


Flume学习01


Flume官方文档翻译之(二)


Hadoop 介绍与环境安装


Hadoop之常用shell命令整理


Spark RDD操作讲解


Spark基础知识


Spark安装搭建与使用


hadoop17--HBASE


hdfs常用命令


HDFS命令


Strata Data Conference Beijing教学辅导课 [多功能厅8A+8B议题介绍]


kafka gc情况在clouder manager 如何查看


ubuntu中spark使用mysql 图文教程


HDFS(Hadoop Distributed File System )常用命令示例:


hadoop基本命令


hadoop学习(5)—— 伪分布下运行一个简单的实例


hive explain详解


hive安装及使用


大数据之谜Spark基础篇,Spark是什么


MapReduce部分:MapReduce的项目:好友推荐【Java版代码】


flume简单介绍


nodejs hbase操作


日志处理架构


6.配置spark环境


flume架构总结


hadoop不重启增删datanode结点


spark基本命令


遇到的Hive的坑


Ceontos7下安装Flume及问题


Flume.apache.org 官方文档学习笔记 part five


Flume:spark-project项目的flume配置


Hive 安装及使用攻略


Kafka相关文章索引(2)


hive on spark安装---安装系列七


hive安装


spark架构设计&编程模型 02


HadoopRDD 的生成过程解析


Hadoop和大数据的渊源


Hive On Spark


Hive学习笔记 --- 深入理解 HIVE 个各种存储模式


Kafka试用记录


kafka环境搭建及demo


3.数据采集 - 文件内容断点续采[flume1.6 + kafka0.10.2.0]


CentOS系统下的Hadoop集群(第5期)_Hadoop安装配置


Flume NG高可用集群搭建


Flume原理


Hbase--Hadoop关于Hbase副本解疑


spark 安装单机版和集群


hadoop入门(一)


kafka 常用命令


分布搭建hadoop环境


大数据之hadoop【hdfs】


HBase shell 的常用命令及语法


Hive四种使用方式


Hive学习笔记 --- Hortonworks 的hive 与 原生hive的差别


centos 创建一个用户


hive使用小结


大数据-Spark的介绍:前世今生


完整配置hadoop的环境变量


Flume收集log到HDFS(优化)


Flume连接HDFS和Hive


Hive集成HBase(二)


HDFS的基本概念


hadoop CLASSNAME命令使用注意点


hadoop text cat head使用


使用线程池控制Phoenix连接超时


Java基础面试题(4)----面向对象的特征


Kafka总结(五):API编程详解


Spark - 深入浅出解析Spark中的RPC (RpcEnv、RpcEndPoint、RpcEndPointRef)


Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍


flume在windows下的启动脚本


hadoop的HDFS文件操作命令


hadoop相关软件下载


kafka入门教程


Flume整合HDFS


Flume(01)——日志采集框架Flume概述


Hive 导入CSV文件


Kafka剖析(一):Kafka背景及架构介绍


hadoop commands(hadoop-2.0.0-cdh4.4.0)


Hive中java对数据库、表的操作


Kafka + SparkStreaming + SparkSQL + MYSQL(DBCP)


Spark:大数据的电花


spark内核揭秘-02-spark集群概览


KAFKA 参数详解(一)


Spark概述详解


java通过jdbc驱动连接hive操作实例


大数据系列之数据仓库Hive命令使用及JDBC连接


HDFS的文件操作


Hive的配置


Spark的运行架构


hive笔记


kafka的模型诠释


大数据Spark企业级实战版【学习笔记】----Spark技术生态系统之Spark Core


HBase基础知识点


Hive SQL使用和数据加载的一点总结


kafka Poll轮询机制与消费者组的重平衡分区策略剖析-kafka 商业环境实战


kafka集群安装


Kafka使用Java客户端进行访问


hadoop 基本命令 和常见错误(笔记)


大数据_FLUME


Hadoop Hive HBase调优


Hive学习笔记2@Hive架构


SparkSQL与Hive on Spark的比较


flume 概述


spark standalone模式作业迁移到spark on yarn


关于linux环境下flume采集日志发布到kafka的配置


Flume OG 与 Flume NG 的对比


Hive on Spark入门设置


Kafka获取文件源码跟踪


Spark算子:RDD行动Action操作(7)–saveAsNewAPIHadoopFile、saveAsNewAPIHadoopDataset


hadoop的hdfs文件操作实现上传文件到hdfs


hive学习3-DDL语句


HBase 官方文档中文版


Hadoop渐进八:Hive配置


Spark Streaming大规模流式处理


Spark算子:RDD行动Action操作(6)–saveAsHadoopFile、saveAsHadoopDataset


FLUME的架构 Flume NG


HDFS学习笔记之


spark 从入门到放弃(一)


为什么越来越多的公司在使用Spark Streaming


4.1HBase安装


Flume 数据采集系统 性能优化和关键问题汇总


Hadoop之——HDFS随笔


Spark Streaming生成RDD并执行Spark Job源码内幕解密


java实现-hdfs上的文件上传下载(windows)


如何获取kafka的broker保存的消费者信息?


高性能mysql的读书笔记(一)


Flume推送数据到SparkStreaming案例实战和内幕源码解密


Spark视频王家林大神第1课: 30分钟彻底理解Spark核心API发展史:RDD、DataFrame、DataSet


log4j输出日志到flume-ng(个人记录)


彷徨 | HDFS客户端基本shell操作


Hbase Java API详解


Hbase的SQL接口之Phoenix使用总结(1)


Hive学习笔记四:浅入


PHOENIX操作HBASE


Spark SQL介绍


Sqoop ------- 将mysql的数据导入到hive中


hadoop hive sql


Flume中阶应用——启动命令详解、组件范例说明、事务说明


Hive安装及使用攻略


Kafka整体结构图、Consumer与topic关系、Kafka消息分发、Consumer的负载均衡、Kafka文件存储机制、Kafka partition segment等


Kafka服务端设计思想


Not implemented by the DistributedFileSystem FileSystem implementation问题解决


再探spark之一(复习之前)加spark如何实现远程调试代码


大数据(七) --Hadoop简介


Hadoop Shell Command


Hadoop分布式集群搭建(一)创建hadoop用户、配置ssh、安装jdk


Hadoop(2)HDFS文件系统


黑猴子的家:Flume案例 监控文件


Flume介绍与配置


HIVE 启动


hadoop 1.x 伪分布式部署及windows开发环境搭建


操作meta表


消息推送整合方案


HBase中表存在但是list时没有该表问题的解决


Hive入门(一):Hive Shell的基本操作


Spark Client部署


Spark操作hive遇到的问题


Spark源代码阅读(一)


flume版本的选择


flume的安装配置及使用


hadoop配置文件详解


Flume基本概念


HDFS知识点总结


kafka与ZK


大数据学习路线图


Hadoop学习笔记(1)安装配置与运行


Spark官方文档 - 中文翻译


Spark:大数据的电花火石!


hadoop1.0.1下hive0.8.1 的安装及其运行示例


kafka源码之日志管理-LogManager


window7下在pycharm上配置pyspark 搭建spark测试环境


Flume入门二__Flume入门案例


Linux命令集合


hadoop生态实战所遇到的问题


hive select报错 Unable to determine if hdfs


Hadoop是什么


大数据笔记16:Hadoop入门


1.Spark及其生态圈简介


HBase 总结(五)


Hadoop入门之WordCount(windows+hadoop2.8.1)


Hadoop学习系列篇说明


Hive 高级编程——深入浅出学Hive


flume的log4j.properties配置说明


spark SQL (一)初识 ,简介


平台搭建---Kafka使用---Kafka重复消费和丢失数据


HDFS Architecture


Hive入门--4.flume-数据收集工具


Spark Programming Guide(二)


hive几种执行sql的方式总结


mac 安装kafka


Hive分类占位文章


Hive核心概念剖析及示例


Hive的管理


SparkStreaming数据流从currentBuffer到Block定时转化过程源码深度剖析-Spark商业环境实战


hive学习提纲


在spark集群中运行程序遇到的一些问题


CentOS7下hbase安装和配置


HBase(01)——HBase数据库基础


HIVE(上)


Hive权限管理


Spark DStream数据源之Kafka


SparkSQL On Yarn with Hive,操作和访问Hive表


flume之Http Source


hbase的shell操作


spark内核揭秘-03-spark核心组件


【hadoop】hadoop参数优化


2017-06-17-openfire-spark安装


Apache Kafka 核心组件和流程-日志管理器-设计-原理(入门教程轻松学)


HDFS NameNode主要内部结构


Hive 学习大纲


Hive部署(包括集成Hbase和Sqoop)


hive server


大数据学习hdfs详解2(write )


Flume学习笔记(二)问题整理


Zookeeper在分布式系统中的应用


kafka介绍,安装以及简单的java调用kafka代码


配置HBASE


Flume传数据到Hadoop双namenode集群传数据可能出现的问题


Hadoop常见的shell命令


Spark定制班第3课:通过案例对SparkStreaming透彻理解三板斧之三:解密Spark Streaming运行机制和架构进阶之Job和容错


hadoop中常用的shell命令


spark知识框架


HDFS概念之联邦HDFS。


flume:java.lang.AbstractMethodError:getMaxBackOffSleepInterval()J


HBASE配置项完整版


Hive安装及启动异常解决


KAFKA CONNECT官网翻译(翻译中。。。)


java 通过jdbc驱动连接hive操作实例


如何使用HBase?大数据存储的两个实战场景


HBase基础教程--1.2.X版本--基础知识篇(一)


Hadoop学习笔记(二)HDFS


Hive体系结构(一)架构与基本组成


Hive使用Spark on Yarn作为执行引擎,yarn资源调度FAIR配置


Spark on Yarn


hadoop shell (收藏)


使用Dtree显示HBase目录


flume架构(一)


hadoop必备书籍《Hadoop, The Definitive Guide》


hive导入数据到表


kafka(三)-kafka安装


把hdfs上的多个目录下的文件合并为一个文件


第21天: 详解Select语法操作


(13)HBase 1.2.6 集群部署


Flume的安装部署


GraphX笔记


Hadoop源码分析笔记(六):HDFS源代码结构和基于IPC调用接口


Kafka 命令行操作


hdfs-命令总结


hive在hadoop中的一个demo运行过程总结


使用flume问题总结3——一个使用flume拦截器和选择器的简单实例


初探kafka


搭建Kafka运行环境-Mac版


Hadoop--hbase


Hadoop(四)HDFS集群详解


Hive(入门)


flume系列之Java heap space大小设置


sqoop job local 和 Cannot initialize Cluster 问题


Apache Kafka核心概念-多图-形象易懂(入门教程轻松学)


Flume ng 实战图解篇


hive 基本命令介绍


【备忘】大数据最火爆技术spark之王家林2016最新高清视频教程


文件收集工具Flume


联邦HDFS(HDFS Federation)


HBase replication


HBase详解


IT学习笔记--Hbase


hadoop fs,hadoop dfs与hdfs dfs之间的区别


hdfs 使用


spark实践


单节点多代理配置


安装 Hbase


安装HBase(使用hbase自带zookpeer)


有关HDFS程序设计:HDFS Shell命令行常见操作


MapReduce 测试自带实例 wordcount


Spark国内外书籍推荐


hive性能优化指南——初级篇


spark源码阅读一-spark读写文件代码分析


Flume日志采集


Hbase导入导出数据


Hive之 hive的三种使用方式(CLI、HWI、Thrift)


系统间通信方式之(Kafka的集群方案介绍1)(二十)


Flume NG 学习笔记(九)Flune Client 开发


Flume 简介


HDFS海量存储


Hadoop HDFS分布式文件系统


Hadoop安装与部署


hdfs的一些基础


Hive常用命令记录


SparkStreaming整合Kafka-0.8的官方文档要点翻译


ambari-server-资源请求分析


Hadoop 启动 YARN


hadoop MapReduce倒排索引编程


hbase shell基本操作


hbase关闭


HIVE作业管理解决方案分析


Hadoop Zookeeper HBase集群


Hbase 数据迁移的常见方式(四)


Kafka 消息偏移量


Kafka_2.10-0.10.0.0安装配置文档


Spark详解


一脸懵逼学习KafKa集群的安装搭建--(一种高吞吐量的分布式发布订阅消息系统)


分布式消息队列Kafka集群安装


初识Hadoop


Spark系类修炼---入门笔记6


hive使用简介


HBase详细介绍及优化


Hive介绍(三)


Kafka官方文档翻译(三)Kafka Streams的使用


hbase常用shell命令


Flume-Flume简介


Hive 内建操作符与函数开发——深入浅出学Hive


大数据学习:Hbase shell的基本操作


正则表达式


Kafka之第一课


MapReduce编程模型之InputFormat分析(二)


Spark入门实战系列--5.Hive(下)--Hive实战


Spark连接到MySQL并执行查询为什么速度会快?


启动命令汇总


第十九记·Flume详解


Apache HBase 问题排查思路


HBase开发实例学习


Kafka的设计思想、理念


Spark定制班第23课:Spark Streaming初始化和关闭源码图解


安装HADOOP伪分布式环境


HBase1.2.4使用Java API创建和删除Table示例程序


hdfs源码以及架构资料整理


hdfs ACL对文件夹实现权限访问控制


hive简介--hive初步认识


kafka和rabbitmq对比(超详细,从实战维度比较)


kafka案例


伪分布式Hadoop及开发环境搭建(三)


基于HBase的大数据存储的应用场景分析


Flume——安装与配置


HBase 第一篇


Ubuntu14.04下安装Hadoop2.4.0 --- 伪分布模式


centos(vm)下安装hive2.1.1单机模式(x86)


hive hive.optimize.ppd=false导致map数量很大


参考一下(转载)


大讲台机构Spark基础


编写hive udf和使用hive udf:hue的hive界面中使用hive udf函数、oozie使用hive udf函数、hive命令行使用udf函数


hive与hbase数据交互的详解指南


sparkstandalon配置


大数据框架


导出Hive表中的数据


用Java访问带有Kerberos认证的HBase


记录


Flume安装及使用


Flume技术原理


Hadoop2 HDFS shell命令


hive服务端启动


spark学习笔记总结


HDFS的shell操作


Spark知识点介绍与安装教程


Spark:SparkSQL与Hive on Spark(Shark)的比较


Spark:hadoop HDFS


SpringStreaming+Kafka


Hive(下)--Hive实战


Spark Streaming初探


flume 1.4的安装 及使用示例


flume学习的总结


spark on hdfs spark处理hdfs上的文件简单的wordcount


spring boot项目中配置kafka


HBase详细介绍


HDFS详细介绍


Hive创建表 org.apache.hadoop.hive.ql.exec.DDLTask. MetaException


Hive(下)-Hive实战


Ubuntu上安装HADOOP单机伪分布式集群


apache kafka总结


flume-kafka-sparkStreaming日志分析


hadoop_hdfs


learning-spark 学习笔记(1):装个环境


笔记:HDFS读取和写入数据流


Flume NG之Agent部署和sink配置HDFS


HADOOP之HDFS


Hive实战


Spark pdf 电子书大全 百度云


Spark内存管理及钨丝计划


hbase+python安装部署及操作


kafka与flume的整合实例


9.在Tachyon上运行Spark


HDFS伪分布式环境搭建-很不错


Hadoop之HDFS原理


MapReduce used in log analysis


flume如何实现高可用和高性能?


结合案例讲解MapReduce重要知识点 ----------- 倒排序


Hadoop报错 Failed to locate the winutils binary in the hadoop


Hbase0.95 学习资料整理


Hive安装部署以及初步使用


Kafka的一些常用命令


java客户端操作hdfs权限问题初探


kafka stream实现wordcount计数


kafka与flume的连接、kafka的python开发


使用HIVE的WEB界面:HWI


合并HDFS和本地文件系统中的小文件


通过案例对SparkStreaming透彻理解三板斧之二:解密SparkStreaming运行机制和架构进阶之运行机制和架构


Flume 架构及部署


Kafka的Replica分配策略之二 Replica变为0了怎么办


hbase性能解决方案


kafka与spark应用


sparkStreaming+flume实现内存计算(小数据量情况下)


使用java操作HBase


单节点搭建flume之exec和spooldir


编写java程序访问spark环境


Spark RDD API 参考示例(四)


SparkML之聚类(一)Kmeans聚类


flume ng简单例子


flume遇见的一些问题


关于使用kafka的个人总结


如何使用kettle连接hive和hive2


引入一个文件夹下所有的包


HBase-MapReduce


Hadoop客户端环境配置


Hive官方文档


Kafka系统工具


Kafka集群镜像操作、集群扩展笔记


Phoenix创建视图映射Hbase中已创建的表


SpringBoot整合Kafka消息


spark sql 执行流程


深入浅出学Hive——Hive安装与配置


阿里云正式推出消息队列Kafka:全面融合开源生态


HBASE中常见问题


flume-ng interceptors


flume与kafka


hdfs常用命令(总结)


kafka相关操作及问题汇总


linux环境下安装kafka


HBase加密存储


一些简单的大数据基础知识


Flume部署


Hadoop与Spark的核心组件对比


docker——kafka集群安装


16.Spark Streaming源码解读之数据清理机制解析


Flume-ng 1.5部署,hadoop联合使用


HBase学习总结


Spark Streaming实时流处理项目实战


hive jdbc


spark内核揭秘-spark任务调度系统


【备忘】零基础学习spark之王家林最新高清视频教程


大数据技术之Hive(一)


Flume环境部署和配置详解及案例大全


Hbase架构与基本概念


Spark RDD API 参考示例(二)


hadoop整合flume


wordcount spark...


在hdfs上存取xml文件的实现代码


Spark 定制版:001~Spark Streaming(一)


hive 0.13.1 安装指导


0129 Kafka 与 Flume 如何选择


Flume初解


HBase框架基础(二)


Hive 优化参数


Spark 2.1.0 单机版 centos 安装


hadoop2.2+hive0.12.0


spark(12)-从Spark架构中透视Job(course21)


2 Hadoop集群搭建


Phoenix二级索引再探


hiveapi通过Java程序调用


spark介绍及RDD操作


【大数据笔记】--Hui无法连接Hbase (Cloudera默认安装)


分布式消息kafka原理分析


HDFS相关命令


Hadoop之HDFS核心知识点


Hadoop集群启动、初体验


Hive安装与配置


Spark:运行原理


分布式日志收集系统Apache Flume的设计详细介绍


Hadoop HDFS Explorer连接Windows上的HDFS


Spark介绍


Spark总结


hadoop备战:hadoop,hbase兼容版本汇总


kafka consumer需要kafka的ip和主机名


kafka学习


spark_基础知识


【Hadoop】Flume官方文档翻译——Flume 1.7.0 User Guide (unreleased version)(二)


HDFS的重要特性


Spark Streaming和Storm对比


hadoop hdfs存储原理


storm集成kafka实例


2、大数据集群搭建之---CDH版本的hadoop集群的安装


Hive与数据库的异同


hadoop fs、hadoop dfs与hdfs dfs命令


hadoop性能测试


hbase 分布式 安装配置 整合到hadoop


hive修改默认元数据存储数据库derby改为mysql


HDFS 常用Shell命令


How To Install Apache Hadoop Pseudo Distributed Mode on a Single Node


关于HBase的几个问答。


Hadoop学习笔记_操作篇之一:HDFS操作


Hive(一)


Kafka生产者示例以及常用参数的解释


认识hadoop


HDFS文件读写流程


Hive 使用方式,即三种连接方式


hadoop入门--通过Apache Flume向HDFS存储数据


hadoop系统 hdfs 命令行操作


kafka生产者Producer参数设置及参数调优建议-商业环境实战系列


5.修改hadoop配置文件


HBase体系结构(转)


Hello~Flume!关于Flume的小分享


Spark与Mysql(JdbcRDD)整合开发(zh)


hadoop2新特性


Flume-ng使用指南


Flume日志采集,avro采集,以及通过参数控制下沉到hdfs的文件大小,时间等控制


Flume读取日志数据并写入到Kafka,ConsoleConsumer进行实时消费


Hive本地独立模式安装


Kafka学习


Kafka整体结构图 Consumer与topic关系 Kafka消息分发 Consumer的负载均衡 Kafka文件存


flume+kafka+zookeeper 单机实现实时数据的获取


【复习】Flume数据收集学习【图片+文字说明】


单机安装HBase


大数据spark“蘑菇云”行动超大型项目实战第68课:spark RDD案例和spark sql案例对比实战 看电影的例子分析 某门热门电影的年龄、性别分析


数据Spark “蘑菇云”行动Hadoop实战速成之路第30课:Hadoop在Eclipse下的编程实战


Hadoop经典书籍


Kafka之数据存储


实战5.Hive(下)--Hive实战


HBase表的架构原理


Spark1.0.0 多语言编程


(4-1)HDFS笔记--命令


Flume安装测试


HBase命令行基本操作


Hadoop分布式文件系统(HDFS)简单的创建,优缺点及其原理


Hadoop的HDFS介绍和操作


引爆Spark大数据引擎的七大工具


Hadoop contrib介绍


Spark Streaming与Storm的对比分析


如何学习大数据?


安装hive-0.10.0-cdh4.5.0整合到hbase


机器学习部分:Python版的Wordcount【Python版代码】


HBase 超详细介绍


Hbase测试&打补丁(HBASE-5415.patch)


flume安装及简单的配置


hadoop, hbase, zookeeper集群搭建


hive sql的学习


spark的task调度器(FAIR公平调度算法)


启动停止守护进程


记一次由于__consumer_offset导致的Kafka故障


Hive学习3:Hive三种建表语句详解


Spark Shuffle 专业级核心参数调优源码深入剖析-Spark商业环境实战


VMware ubuntu12.10上伪分布式安装hadoop0.20.2


hadoop中NameNode、DataNode、Secondary、NameNode、ResourceManager、NodeManager 介绍


spark入门教程及经验总结


spark大数据架构初学入门基础详解


【spark】内存管理


HBASE集群搭建


Hbase多列范围查找(效率)


hadoop 2.4.1 集群安装二


hive 基本命令操作


【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第三步)(2)


不使用USERADD,手动添加用户


Flume的安装和配置


Hadoop+Hbase+Spark集群配置—Hadoop HA安装


KafKa介绍(分布式架构)


Kafka操作梳理


rocketMq和kafka的架构区别


大数据和云计算技术周报(第36期):NoSQL特辑


海量日志收集利器 —— Flume


Flume TailDirSource问题


Flume使用入门 & 入门Demo


HBase学习之路——HBase单机安装


Hadoop项目


hbase命令


hbase学习--1 使用 java api 创建表


hive收集


搭建Spark真实分布式运行环境


HBase学习笔记 --- RDBMS sqoop 导入数据到HBase


HBase常用操作命令


HDFS常用的文件操作命令


hadoop hive 基本操作命令


Hive整合HBase,操作HBase表


HDFS的设计目标


Kafka


Kafka之Producer篇


Kafka学习资料


Mac idea maven搭建HBase源码编译运行环境


Ubuntu下使用Python开发Spark程序


centos7通过命令来查看NameNode的状态(是Active还是Standby)


spark sql简单示例java


一:hadoop和spark的区别


Hadoop伪分布模式操作


kafka Windows 配置入门.md


联接HIVE SERVER客户端的三种方式


2.配置hadoop环境


Zookeeper在Kafka中的应用


kafka基本命令使用


Kafka安装及使用


OpenTSDB安装HBase


学习Hadoop第七课(HDFS架构原理)


试用Hive on Spark


Hadoop学习目录导航


Kafka操作随笔


Yarn简介(二)


hive架构设计及源码研究


kafka消费者总结(一)


spark 源码分析


第101讲: 使用Spark Streaming企业实际数据处理流水线完整声明周期


Ffume不同模式下的代码示例


Flume 1.7 源码分析(一)源码编译


Flume架构的简单学习


Hive权限之审计


hadoop入门(二)


kafka自动化脚本一键启动


查看当前服务器中的所有的topic,创建topic,删除topic,通过shell命令发送消息,通过shell消费消息,查看topic详情,对分区数进行修改


HBase——安装配置与shell操作


hadoop dfs和hadoop fs命令的区别


hbase 备份及恢复


spark从入门到放弃五十二:Spark Streaming(12)结合spark Sql


winlogbeat监听windows日志到kafka、hdfs,不同层级取数据


Flume入门


Kafka原理框架汇总


hadoop入门文档


hadoop离线计算与storm实时计算的细分对比


通过IO流操作 HDFS代码实现


CentOS 6.5 配置hadoop 2.6.0伪分布式


Flume的安装及简单的使用(一)


HBase体系结构


flume 安装及应用


(7-4)hive与外部资源的交互


Hadoop端口一览表


Hive 的启动方式


子雨大数据之Spark入门教程---Spark入门:Spark的部署模式1.4


HBase简介,基本组成,基础架构


JAVA操作HDFS案例


Spark为什么能成为大数据分析主流工具?


python 调用spark


hadoop-HA启动,以及配了HA之后hdfs的路径问题


hbase 一致性 问题思考


kafka 单机的安装和测试


Hadoop学习第七课(HDFS架构原理)


Linux搭建kafak集群 + log4j


Ubuntu 14.04 搭建单机版 hadoop 2.6.0 环境


hive数据库数据次数统计排序


hive速查


删除HDFS集群中的所有空文件和空目录


在 YARN 上运行 Spark


技术-Hive


技术积累


HDFS和本地文件系统文件互导


Hadoop Ecosystem World-Map


Ranger-Kafka插件安装


hadoop之 HDFS fs 命令总结


干货 | Spark入门到精通(001)


Flume 流入远程 hbase


HBase入门及实践


Kafka学习整理一(基础概念)


Spark安装


StreamingContext启动流程及Dtream 模板源码剖析-SparkStreaming商业环境实战


spark操作hbase


解决Flume采集数据时在HDFS上产生大量小文件的问题


Hadoop启动过程


Hadoop命令


Spark动态资源分配-Dynamic Resource Allocation


spring kafka整合


使用Apache Phoenix 实现 SQL 操作HBase【包括部分软件安装】


3.安装HADOOP


CDH5.12.1启动HDFS失败 namenode无法启动(namenode格式化失败)


Kafka笔记-2-kafka安装步骤及常用命令


flume NG 中文 Welcome to Apache Flume 第一页 醉了


flume+kafka+storm整合


hive快速上手


本地如何连接hbase数据库


Hbase架构与原理


Spark学习五:spark sql


Ubuntu16.04 Docker安装Hive(使用mysql作为元数据库),以及beeline连接


flume将日志到hive实现


Hive学习笔记 --- hive中导入数据文件的四种方式


kafka学习二:构建Kafka集群


python 连接 hbase 失败


使用flume收集日志


Hadoop MapReduce高级编程


Spark视频王家林大神 第7课: Spark机器学习内幕剖析


flume与spark-streaming联通(测试过程)


flume如何向kafka写数据


flume详解


高效搭建Spark完全分布式集群


kafka简介以及在Ubuntu环境下kafka的安装和实例介绍


spark中RDD算子介绍


02_note_分布式文件系统HDFS基本操作与特性,HDFS API编程示例;2.x下HDFS新特性,高可用,联邦,快照


Apache kafka 工作原理介绍(作者原创文章已发表在IBM开发者论坛)


HBase编程实例


HDFS中读取文件总结


HDFS的架构要点


Hadoop 2.7.2 集群搭建


Kafka 基础概述


Spark的architectue


启动Hbase后Hmaster节点挂掉的几个原因


第3章 实战环境搭建


Idea 编写 Spark 示例代码并打包成Jar


kafka总结


大数据技术之Flume 配置示例


大数据第三季--flume(day2)-徐培成-专题视频课程


HDFS 操作命令


ambari安装集群下安装kafka manager


cdh_集群spark2_中_kafka_版本配置问题


flume安装与配置


hadoop编程:暴力破解ZIP密码


Flume日志采集系统与Logstash对比


Flume简介与安装


HIVE 的安装部署


Hadoop一些常用的命令以及DataNode、Yarn节点服役、退役


Flume数据采集准备


Kafka原理


hbase入库几种方式


Flume-应用案例(一)


KafKa常用命令


如何在spark中删除hdfs的某个文件夹


HADOOP学习-HDFS


Hbase框架详解和读写流程分析


Hive学习笔记(4)


Hive(四)hive函数与hive shell


hbase安装及配置


spark的使用


什么是Spark


2.关于Apache Spark


6、 分布式数据库Hbase


Hive的三种Join方式


Phoenix创建视图和索引--基于HBase


Spark2.0.1 on yarn with hue 集群安装部署(八)hue+livy+spark整合


Spark开发指南Spark Programming Guide


hbase shell操作命令简介


小木大数据-kafka安装及配置


Flume + Kafka学习——整合Demo


Flume NG简介及配置 1.5.2


HDFS java 操作 HDFS


Hadoop Hive 搭建


Hadoop笔记:HDFS读官方文档


Spark相关文章索引(3)


flume 读取kafka 数据


hive与HBase整合


关于cloudera安装碰到的那些坑


复习总结01:Hadoop


大数据第三天--HDFS SHELL 命令总结


最容易理解的Hive跟mysql比较


第51课: Spark大型项目下的Spark Streaming本质剖析


Storm部分:伪分布式Hbase的安装


Ubuntu12.04下安装Hadoop2.4.0 (单机模式)


spark on hive


spark2.2.0源码阅读---spark core包 --- rpc模块


Hive JDBC——深入浅出学Hive


flume-ng demo单机配置详解


hbase shell启动报错(KeeperException$ConnectionLossException)


【Hadoop】HBase框架学习之路


第一章:Hadoop 2.X入门-CSDN就业班-专题视频课程


Hive表


NameNode


Spark编程


hbase_hase的底层结构


hbase的HQuorumPeer和QuorumPeerMain


Flume-ng的原理和使用


HDFS常用命令列表


Hadoop基准测试


hp(1) ubuntu 安装 hadoop (单机版)


一些基础的HDFS命令


深入浅出学Hive——Hive JDBC


hbase(三)-基本的hbase shell命令


spark和hadoop的比较


使用Docker容器模拟分布式flume


实践部署与使用apache kafka框架技术博文资料汇总


(7-2)hive参数配置使用


(一) Hadoop之HDFS


hadoop学习笔记2


hive导出hbase数据


四、HBase Shell


大数据IMF传奇行动绝密课程第88课:SparkStreaming从Flume Poll数据案例实战和内幕源码解密


大数据_hive_命令行


HBASE 常用语法和phoenix 配置


Python连接Hive


使用在hdfs上的文件导入到hive中


深入浅出Hive


hadoop(hdfs mapreduce)及异常处理


kafka单机部署


实战1.Spark及其生态圈简介


Hadoop中-put和-copyFromLocal的区别


Hive Shell 常用操作


hadoop经典书籍


hbase 通过mapreduce方式对hbase表的备份及恢复(export import)


mac安装hadoop记录


大数据系列第三课:scala中阶


HIVE---HIve的JavaAPI操作


Spark On YARN 一些基本参数


linux cp.rm,scp等命令出现 “略过目录”或者目标是一个文件夹得解决方案


FLUME日志收集详解


Kafka集群环境搭建


flume使用(五):taildirSource重复获取数据和不释放资源解决办法


hadoop概况与hdfs部署


hdfs的基本原理和基本操作总结


spark内核揭秘-04-spark任务调度系统个人理解


HBase in Action-第二部分Advanced concepts-(3)非Java客户端【REST、Thrift】


Hive 1.1.1 启动错误


flume学习笔记(一)


hive学习入门


二、HBase深入使用(1)—HBase数据存储


第十四天 - JavaWeb结合Hive - Hive外部表 - Hive内置函数 - Hive自定义函数


Apache Kafka 核心组件和流程-控制器-设计-原理(入门教程轻松学)


Flume(ng) 自定义sink实现和属性注入


HBase常用命令


HDFS中读写文件流程


hive之datanucleus常见问题及解决办法


Debug HDFS (远程调试HDFS)


Spark学习笔记 --- scala实现Spark wordcount例子


hadoop fs api


sqoop-1.4.5安装指导


前回顾


(7-7)hive复合数据类型


HBase多线程建立HTable问题


Spark Checkpoint读操作代码分析


Spark学习笔记一:Spark.core


hadoop 常用配置


HDFS几个常用命令


Hadoop学习笔记(四)(Hive)


Hadoop实例运行


Hadoop的Shell操作


Hue安装配置


Kafka集群搭建02-Kafka 集群部署


Spark开发环境的配置


hadoop hdfs dfs 命令讲解


hive 中日志的存放位置


hive--2014.6.10


hive支持sql大全


搭建Hadoop单机伪分布式环境


Flume使用指南


Flume核心概念


HDFS Java API配置用户(远程用户)


Hadoop基础教程-第10章 HBase:Hadoop数据库(10.3 HBase安装与配置)(草稿)


Hive 和数据库的异同


Spark入门


wince6 HIVE注册表的存储位置


Awesome Hadoop


使用Sqoop把Oracle表导入Hive


大数据笔记-Hive


Apache Flume


HBase 官方文档


HBase是什么?


Hive创建表的几种方式


Hive环境搭建


Spark Streaming基础与实践


Windows和Linux环境搭建kafka服务(三)


hbase 索引记录


hdfs文件操作


hive安装——mysql作为元数据,使用beeline


kafka0.9升级纪实


什么时候才应该使用HBase?


通过JDBC来连接Hive


Hive中union使用详情


Spark源码分析-master启动


spark结构化数据处理:Spark SQL、DataFrame和Dataset


HBase Shell基本命令


HDFS用户手册[官方整理]


Spark 2.2.1 官方文档翻译 RDD编程指南(RDD Programming Guide)


Spark性能相关参数配置-大全


hadoop-2.7.4-翻译文档-联邦HDFS


hbase常去学习网站


Apache Hadoop YARN: 背景及概述


记下最近想关心的技术


Hive入门教程


Java代码通过JDBC连接Hiveserver2


Maxwell_kafka_bireme同步数据部署方案


hadoop-(2)wordcount运行


hbase 备份及恢复


《Hadoop基础教程》读后感


HDFS Federation


HDFS下的文件操作


Hadoop之——重新格式化HDFS的方案


Ubuntu16.04下搭建Hadoop2.7.4运行示例工程


hive存储处理器(StorageHandlers)以及hive与hbase整合


logstash


大数据密训第九课:IDEA下开发Spark程序


深入浅出学Hive——Hive参数


Hadoop,HBase,Storm,Spark到底是什么?


Kafka实现细节(上)


Spark sql执行流程


ubuntu下环境变量配置


搭建Hadoop2.7.3+Hive2.1.1及MySQL(配置Hive+Hadoop)(二)


HDFS详解


Hive学习1


Hive安装配置详解


Kafka + Spark Streaming + Redis 实战项目


Spark学习笔记-HBase操作


hive的SQL总结


大数据学习笔记之flume----日志收集系统


用clojure查看hdfs文件系统


1002-HBase本地安装方式


Docker下极速体验Kafka


HIVE 基本概念


Hadoop全分布式搭建


Kafka是如何实现高吞吐率的


Spark历险记之编译和远程任务提交


Spark天堂之门笔记


基于CentOS6.5编译Spark2.2.0源码


Apache Kafka 入门 - Kafka命令详细介绍


Hive DDL


Hive 内建操作符与函数开发


Hive和Hbase的数据整合联系


Spark1.6.0-Hadoop2.6配置过程


kafka本地环境的搭建,以及本地java测试的调用


使用distcp并行拷贝大数据文件


HBase专题介绍 4


Hadoop分布式安装


Hadoop实战-初级部分 之 Shell


Hive官方手册翻译(Getting Started)


hadoop知识点汇总


springboot整合kafka


使用hive来分析flume收集的日志数据


Flume启动与配置文件


HBase官方指南(译.一)


Hadoop 2.x配置及简单MapReduce案例


Spark修炼之道系列教程预告


hadoop2.2.0安装详解


sqoop基本 操作


spark学习-31-spark2.2.0中Utils.getCallSite()的作用


Flume NG 学习笔记(三)流配置


Flume(日志采集工具)


Hadoop HDFS 运行原理


Hive学习之路 (三)Hive元数据信息对应MySQL数据库表


Linux安装配置Kafka


hadoop-HDFS


hadoop学习笔记(二)


hive的最简单部署


创建用户及用户组


大数据之hbase(五) --- 导出Hbase的表文件到HDFS,Hbase Bulk Load Hbase,MySQL数据通过MR导入到Hbase表中


黑猴子的家:Hadoop 入门


HBase数据导入方式


Spark与hadoop错误解决


linux 单机模式HBase (一)


配置hadoop2.4.0记录


Hive权限管理默认认证-传统模式


Spark Catalyst的实现分析


Spark SQL基础学习【二】以编程方式执行Spark SQL查询


flume+kafka+hdfs日志系统


flume学习(二)


kafka学习总结


离线计算七 辅助系统(flume、sqoop、oozie)


Flume和SparkStream结合的两种方式--pull


HBase Tools and Utilities


HDFS 文件操作命令格式与注意事项


Hadoop 伪分布式搭建


Hadoop的核心设计


flume-NG整合hdfs和kafka


hdfs的操作命令


hive


spark部署:在YARN上运行Spark


社区版Federated HDFS(多Name Node)实现浅析


Apache Spark 内存管理详解


Hadoop学习笔记


Kafka实战-简单示例


Spark Streaming整合flume实战


StreamAnalytix Visual Spark Studio (二)!Spark开发史上最强大的神器,只需拖拽控件即可完成Spark开发,造福国内的Spark开发者!


hadoop学习(五)


关于大数据处理和Hadoop的一些文章【持续更新】


架构设计:系统间通信(30)——Kafka及场景应用(中3)


电商之梳理Flume相关知识---数据采集


Linux 添加用户并添加组过程


SparkSQL操作Hive Table


【三】Spark Streaming理论


简单认识下注册表的HIVE文件格式


HBase的服务器体系架构


hadoop前期开发准备


kfaka


怎么改变HDFS块大小


Flume把命令执行结果写入平面文件


Kafka实战-Kafka到Storm


Kafka知识点总结二


HBase框架基础(一)


Hadoop实战-中高级部分 之 Hadoop MapReduce工作原理


Hbase的shell命令练习


hadoop自学路线


spark core组件:RDD、DataFrame和DataSet介绍、场景与比较


伪分布式Hadoop配置安装


Hbase 介绍


Kafka性能测试与详解


Spark 学习资源收集


Kafka 个人总结


flume一:flumeSource介绍


【Hadoop】Hadoop生态圈基本组件介绍


2.消息队列 - 采集和计算对接[kafka0.10.2.0]


Hadoop 1.2.1 伪分布升级到 2.6.0伪分布(八)


Spark SQL与Hive on Spark的比较


hdfs创建文件出错


hive remote安装


spark--入门小练习


使用自带Zookeeper搭建kafka集群


第2课:通过案例对SparkStreaming 透彻理解三板斧之二:解密SparkStreaming运行机制和架构


Flume NG与MySQL整合开发


FlumeNG1.3.1在Source Exec tail 文件方面的一个缺陷以及改进方式


Hive学习笔记 --- Hive分区表的操作


从零到一spark进阶之路(三) pyspark 处理movies数据集(整理ING6-20)


快学Big Data -- Flume(十五)


Spark Streaming:初步了解


flume入门配置


flume日志写入hbase问题记录


hive strict模式


高可靠性、高性能、可伸缩、分布式、基于列存储的非关系型(NoSQL)数据库——Hbase


HDFS的Shell基本操作


Hadoop笔记:HDFS shelll常用命令的使用


Hbase学习全程记录——在Ubuntu中安装HBase(修改)


Spark on Hive


跟天齐老师学Spark(3)--搭建Spark环境


Kafka实际使用过程中遇到的一些问题及解决方法


Pentaho Kettle Loading Data into HBase


hadoop学习记录2017年11月20日14:25:55


java kafka 连接错误


kafka2.11单机版安装教程


Hbase安装


Spark相关文章索引(2)


flume、kafka、avro组成的消息系统


hbase目录导图


大数据IMF传奇行动绝密课程第91课:SparkStreaming基于Kafka Direct案例实战和内幕源码解密


Hadoop实战-中高级部分 之 Hadoop RestFul


Spark从零开始


hadoop shell 常用命令


kafka zookeeper graylog filelog 监控配置


Hive Metastore 初探


Spark Demo程序运行及相应问题


Spark、Python spark、Hadoop简介


Titan连接Hbase后端


hadoop中hdfs通讯原理


安装HBase出现的问题


用Apache Spark进行大数据处理——第二部分:Spark SQL


Hadoop群组服务器部署使用介绍(一)


Hiveserver2的使用


Hive整合Hbase(一)


hadoop fs -mkdir 报错 No such file or directory


thrift2访问hbase


Hive知识点总结(四)


Spark入门,概述,部署,以及学习(Spark是一种快速、通用、可扩展的大数据分析引擎)