Apache大数据组件

2017-04-30

分布式

Apache, 分布式

概述

大数据的处理模式大体可以分为批处理（也可称为离线计算）、流式计算（数据实时性高）、在线处理（即时响应）和交互式分析（允许分钟级）四种。

大数据的4V属性
数量（Volume），多样性（Variety），速度（Velocity），真实性（Veracity）

HDFS

组成组件

Spark计算平台

2017-04-30

Spark

前言

官方文档

Spark doc

Java高级篇

2017-04-30

Java

前言

本系列文章将分为三部分：

Java基础篇

语法篇
数据结构篇
集合框架

Java基础篇

2017-04-30

Java

前言

本系列文章将分为三部分：

Java基础篇

语法篇
数据结构篇
集合框架

Linux 系统管理常用命令（不定时更新）

2017-04-29

Linux

运行脚本的方法

常用运行方法:

$ bash a.sh
$ chmod +x a.sh
$ ./a.sh
$ source a.sh

数据结构基础

2017-04-29

Basis

Tree

完全二叉树

只有最下面的两层结点度小于2，并且最下面一层的结点都集中在该层最左边的若干位置的二叉树，不一定有排序；

满二叉树

除了叶结点外每一个结点都有左右子叶且叶结点都处在最底层的二叉树。

平衡二叉树（AVL）

平衡二叉树（Balanced Binary Tree）是二叉查找树（也称为排序二叉树，左小于右）的一个进化体，也是第一个引入平衡概念的二叉树。1962年，G.M. Adelson-Velsky 和 E.M. Landis发明了这棵树，所以它又叫AVL树。平衡二叉树要求对于每一个节点来说，它的左右子树的高度之差不能超过1，如果插入或者删除一个节点使得高度之差大于1，就要进行节点之间的旋转，将二叉树重新维持在一个平衡状态。这个方案很好的解决了二叉查找树退化成链表的问题，把插入，查找，删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间，不过相对二叉查找树来说，时间上稳定了很多。