使用HBaseShell接口的注意事项

HBase Shell 接口本身没有什么可谈的,网上许多内容都有介绍, 半个小时就可以入门。同事们要我推荐一下,那就推荐三个如下:

成都创新互联是一家专注于网站制作、成都网站制作与策划设计,向阳网站建设哪家好?成都创新互联做网站,专注于网站建设10多年,网设计领域的专业建站公司;建站业务涵盖:向阳等地区。向阳做网站价格咨询:18982081108

(1) http://wiki.apache.org/hadoop/Hbase/Shell

(2)  ./hbase shell 打开shell, run 'help' to get help information

(3)http://qibaopeng2000.blog.163.com/blog/static/691776952010112444553279/ (这个网上很多相同或者类似的内容)

总结培训当天反馈的问题,新手们需要注意几点:

问题1,  HBase(可以理解为不需要建'name'列,hbase自动建立一个用于存储“行标识”的“列”),举例如下:

例一:

 
 
 
  1. reate 'employees', 'SN', 'department', 'address'   这个employees表的结构将为:
  2. row_id     SN    department    address
  3. --------------------------------------------------

共有四列,***列用于标识行, 这里你可以当做‘name’来用

插入数据: put 'employees', 'HongKong', 'SN:', '20080501'

注意是put,不是Ruby的puts

对比的情况:

创建表: create 'employees', 'name', 'SN', 'department', 'address'

此时数据为: 除了标识本身外,还有一个name列,下面简单设置为一样的值。

put 'employees', 'HongKong', 'name:', 'HongKong'

例二:

网上流行资料的例子:

一个存储学生成绩的表:

 
 
 
  1. name grad      course:math   course:art
  2. Tom    1                87                97
  3. Jerry   2              100                 80

这里grad对于表来说是一个列,course对于表来说是一个列族,这个列族由两个列组成:math和art,当然我们可以根据我们的需要在 course中建立更多的列族,如computer,physics等相应的列添加入course列族.  建立一个表格 scores 具有两个列族grad 和courese

 
 
 
  1. hbase(main):002:0> create 'scores', 'grade', 'course'
  2. 0 row(s) in 4.1610 seconds

分析,请注意,为什么创建的表是没有“name”这一列呢? 其实这里的name列就对应例一的row_id,不用显式创建的。

导入数据为:  put 'scores', 'Tom', 'grade:', '1'     , Tom对应name

问题2.参数的警告说明

很多人开始都碰到类似

 
 
 
  1. hbase(main):034:0> put 'employees', 'HongKong', 'name:', 'Hongkong', 'SN:', '20080501'
  2. ArgumentError: wrong number of arguments (6 for 5)
 
 
 
  1. hbase(main):033:0> put 'employees', 'Kong', 'name:' 'Kong'
  2. ArgumentError: wrong number of arguments (3 for 4)

这是参数数量不对的说明, 请尤其注意逗号, 空格不能用来分隔参数的。

以put为例,参数一般为5个, 6个 10个都报错。但为什么又有(3 for 4)呢?  5和4个的时候可以工作呢?  timestamp 是optional的。所以参数多的时候, 按照上限5报警,少的时候按照下限4报警。

 
 
 
  1. put       Put a cell 'value' at specified table/row/column and optionally
  2.            timestamp coordinates.  To put a cell value into table 't1' at
  3.            row 'r1' under column 'c1' marked with the time 'ts1', do:
  4.            hbase> put 't1', 'r1', 'c1', 'value', ts1

问题3.  插入数据

 
 
 
  1. hbase(main):030:0> put 'employees', 'Tom', 'name:' 'Tom', 'SN:', '20091101', 'department:', 'D&R', 'address:country', 'China', 'address:city', 'Beijing'
  2. ArgumentError: wrong number of arguments (11 for 5)

怎么回事呢?  不要老想着SQL, put插入的Cell数据,  这么多一起来,当然报错咯

问题4. 删除表必须先停,然后再删: To remove the table, you must first disable it before dropping it

 
 
 
  1. hbase(main):025:0> disable 'test'
  2. 09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test
  3. 0 row(s) in 6.0426 seconds
  4. hbase(main):026:0> drop 'test'
  5. 09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test

问题5. 如何运行脚本文件

 
 
 
  1. ${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT
  2. 示例:
  3. ./hbase shell /data/automation/create_import.hbase
  4. --------------------------------------------------------------------------------------------
  5. disable 'employees'
  6. drop 'employees'
  7. create 'employees', 'SN', 'department', 'address'
  8. put 'employees', 'HongKong', 'SN:', '20080501189'
  9. put 'employees', 'HongKong', 'department:', 'R&D'
  10. put 'employees', 'HongKong', 'address:country', 'China'
  11. put 'employees', 'HongKong', 'address:city', 'Beijing'
  12. put 'employees', 'Cudynia', 'SN:', '20010807368'
  13. put 'employees', 'Cudynia', 'department:', 'HR'
  14. put 'employees', 'Cudynia', 'address:country', 'US'
  15. put 'employees', 'Cudynia', 'address:city', 'San Francisco'
  16. exit

文章名称:使用HBaseShell接口的注意事项
本文URL:http://www.csdahua.cn/qtweb/news1/488601.html

网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网