最近由于工作需要,要从hbase中读取数据,然后处理过后,展示给用户,在网上搜通过Python的happybase模块可以进行简单快捷的读取,但是在安装happybase,让我非常不开心,具体错误如下: Collecting happybase Using cached https://files.pythonhosted.org/packages/8d/a4/9c1202ad4276d4e8... 作者:IT_DREAM_ER 发表于 2018/09/27 08:27:17 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/82861736 阅读:851 评论:1 查看评论 继续阅读 >>


周攀 18/09/27 08:27:17
类也是对象 在理解元类之前,你需要先掌握Python中的类。Python中类的概念借鉴于Smalltalk,这显得有些奇特。在大多数编程语言中,类就是一组用来描述如何生成一个对象的代码段。在Python中这一点仍然成立: >>> class ObjectCreator(object): … pass … >>> my_object = Obj... 作者:IT_DREAM_ER 发表于 2018/02/23 20:53:34 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/79356880 阅读:278 继续阅读 >>


周攀 18/02/23 20:53:34
Zookeeper简介zookeeper是一个为分布式应用所设计的开源协调服务,提供同步,配置管理,分组和命名服务。 设计目标: 简单化 zookeeper允许分布式的进程通过共享体系内的命名空间来进行协调,其组织与标准的文件系统非常相似,是由一些数据寄存器组成,在zookeeper中,这些寄存器称之为znode。zookeeper的数据存放在内存当中,因此其具有高吞吐量和低延迟。 健壮性 z 作者:IT_DREAM_ER 发表于 2017/08/21 09:47:47 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/77141701 阅读:2470 继续阅读 >>


周攀 17/08/21 09:47:47
[unix_http_server]             file=/tmp/supervisor.sock   ; socket文件的路径,supervisorctl用XML_RPC和supervisord通信就是通过它进行                               的。如果不设置的话,supervisorctl也就不能用了 作者:IT_DREAM_ER 发表于 2017/08/08 16:45:28 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/76918521 阅读:713 继续阅读 >>


周攀 17/08/08 16:45:28
最近舍友推荐了一个免费的VPN,感觉用起来挺好的,速度很快,youtube视频可以直接看,于是向大家分享一下: 如果可以进入Google应用商店,那么直接搜: tunnello 然后安装即可。 要是无法进入Google应用商店或是无法正常下载安装 请点击:https://pan.baidu.com/s/1eScl5J0 密码:2aiw 如链接不可用,请邮件联系:zhoupans_mail@163.com 下载到插件,正常安装即可,如果不知怎么安装,请点击:Chrome安装插件 安装完成,打开就如下图: 点击Go,然后会跳转页面至如下页面: 此页面需要FQ,嗯,你懂得,点击这里: https://laod.cn/hosts/2017-google-hosts.html 比较慢,请耐心等待。 然后就是需要注册: 注册成功之后,正常登陆: 登陆成功: 以后点击go,就可以连接上了: 于是就可以浏览被墙的网页了,同时提供好多不同的节点, 继续阅读 >>


周攀 17/08/08 16:42:34
HBase是一个开源的,分布式的,多版本的,面向列的存储模型。 面向列:简单来说,就是指在存储数据库中的数据时,以列为单位来存储,把一列的数据串在一起存储起来,而非把一行的数据作为一个单元存储起来。 HBase的特点: HBase是构建在HDFS上的列式存储系统 基于Google的BigTable模型开发,典型的key/value系统 逻辑上,HBase将数据按照表,行和列进行存储 HBase主要 作者:IT_DREAM_ER 发表于 2017/08/07 09:38:13 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/76691415 阅读:394 继续阅读 >>


周攀 17/08/07 09:38:13
开发用了很久的Vertica,知道它是“列式数据库”但一直没有去研究过列式数据库的一些特性,现在来总结一下。 列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。 数据库以行、列的二维表的形式存储数据,但是却以一维字符串的方式存储,例如以下的一个表: E 作者:IT_DREAM_ER 发表于 2017/08/02 09:16:32 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/76566848 阅读:963 继续阅读 >>


周攀 17/08/02 09:16:32
Hive是什么Hive是一个基于Hadoop文件系统的数据仓库,提供了对数据进行ETL(抽取,转换,加载)的工具、数据存储管理和大型数据集的查询分析能力。Hive提供了类SQL语言-HiveQL,可使用关系数据库提供的的SQL语句来操作Hive。Hive擅长做什么? Hive擅长在不变的、大规模的数据集上执行的批量操作。 Hive具有良好的扩展性,因为其建立在HDFS上,可自动适应机器数目和数据量的 作者:IT_DREAM_ER 发表于 2017/07/31 21:54:07 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/76416713 阅读:275 继续阅读 >>


周攀 17/07/31 21:54:07
前面分享了hadoop伪分布式的搭建方法,这次来分享一下分布式方式的搭建方法。 主机安装或虚拟机安装这里就不再赘述,下面直接进入正题:1.下面是网络配置,全部为静态:master : 192.168.80.128 slave-1 : 192.168.80.129 slave-2 : 192.168.80.130 slave-3 : 192.168.80.131 slave-4 : 192.168. 作者:IT_DREAM_ER 发表于 2017/07/14 18:50:05 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/75126020 阅读:417 继续阅读 >>


周攀 17/07/14 18:50:05
HDFS为是Apache Hadoop Core项目的一部分,是Hadoop的核心项目,今天我们就来讨论以下关于HDFS架构设计问题。分布式既然HDFS标榜为一个分布式文件系统,那首要解决的就是分布式的问题。分布式,简单来说就是分布在各个节点,这些节点可能在不同的主机上,也可能在不同的数据中心,甚至还可能跨地区,跨国度。各节点之间通过网络来进行信息交互。DHFS通过Namenode和Datanode 作者:IT_DREAM_ER 发表于 2017/07/14 14:04:55 原文链接 https://blog.csdn.net/IT_DREAM_ER/article/details/75038234 阅读:409 继续阅读 >>


周攀 17/07/14 14:04:55