舟山市成人专升本考试:cassandra(三)--编写java代码对分布式数据库进行操作

来源:百度文库 编辑:九乡新闻网 时间:2024/05/07 13:16:27
本文主要关注两个部分,
1. 怎么写一个最简单cassandra的sample
2. 通过代码,了解cassandra的数据模型及隐藏在后面的交互逻辑


步骤一:
首先我们创建一个工程,然后将cassandra/lib目录下的包,导入到我们的工程中。
步骤二:
创建一个类,内容如下:
Java代码
  1. import org.apache.cassandra.thrift.Cassandra;  
  2. import org.apache.cassandra.thrift.Column;  
  3. import org.apache.cassandra.thrift.ColumnPath;  
  4. import org.apache.cassandra.thrift.ConsistencyLevel;  
  5. import org.apache.cassandra.thrift.InvalidRequestException;  
  6. import org.apache.cassandra.thrift.NotFoundException;  
  7. import org.apache.cassandra.thrift.TimedOutException;  
  8. import org.apache.cassandra.thrift.UnavailableException;  
  9. import org.apache.thrift.TException;  
  10. import org.apache.thrift.protocol.TBinaryProtocol;  
  11. import org.apache.thrift.transport.TSocket;  
  12. import org.apache.thrift.transport.TTransport;  
  13. import org.apache.thrift.transport.TTransportException;  
  14.   
  15.   
  16.  public class SampleOne {    
  17.      static Cassandra.Client cassandraClient;    
  18.      static TTransport socket;  
  19.      
  20.      
  21.      private static void init() throws TTransportException {    
  22.          String server = "192.168.1.129";    
  23. //       String server = "localhost";  
  24.          int port = 9160;    
  25.      
  26.          /* 首先指定cassandra server的地址 */    
  27.          socket = new TSocket(server, port);    
  28.          System.out.println(" connected to " + server + ":" + port + ".");    
  29.      
  30.      
  31.          /* 指定通信协议为二进制流协议 */    
  32.          TBinaryProtocol binaryProtocol = new TBinaryProtocol(socket, false, false);    
  33.          cassandraClient = new Cassandra.Client(binaryProtocol);    
  34.      
  35.      
  36.          /* 建立通信连接 */    
  37.          socket.open();    
  38.      }    
  39.      
  40.      
  41.      public static void main(String[] args) throws TException, TimedOutException, InvalidRequestException, UnavailableException, NotFoundException {    
  42.          /* 初始化连接 */    
  43.          init();    
  44.      
  45.      
  46.          /* 选择需要操作的Keyspaces, 可以理解成数据库的表 */    
  47.          String keyspace= "Keyspace1";    
  48.          String row = "employee";    
  49.      
  50.          /* 创建一个Table Name */    
  51.          String tableName = "Standard2";  
  52.            
  53.          /* 插入一条记录 */  
  54.          insertOrUpdate(keyspace,tableName,row,"name","happy birthday!",System.currentTimeMillis());  
  55.          /* 删除一条记录 */  
  56.          //delete(keyspace,tableName,row,"name",System.currentTimeMillis());  
  57.          /* 获取一条记录 (由于插入和删除是同一条记录,有可能会检索不到哦!请大家主意!*/  
  58.          Column column = getByColumn(keyspace,tableName,row,"name", System.currentTimeMillis());  
  59.          System.out.println("read row " + row);    
  60.          System.out.println("column name " + ":" + new String(column.name));    
  61.          System.out.println("column value" + ":" + new String(column.value));    
  62.          System.out.println("column timestamp" + ":" + (column.timestamp));    
  63.            
  64.          close();  
  65.      }  
  66.        
  67.      /** 
  68.       * 插入记录 
  69.       */  
  70.      public static void insertOrUpdate(String tableSpace,String tableName, String rowParam,String ColumnName,String ColumnValue,long timeStamp)    
  71.         throws TException, TimedOutException, InvalidRequestException, UnavailableException, NotFoundException{  
  72.          /* 选择需要操作的Keyspaces, 存放数据表所在的空间位置 */    
  73.          String keyspace= tableSpace;  
  74.          /* 数据所在的行标 */  
  75.          String row = rowParam;    
  76.      
  77.          /* 创建一个column path */    
  78.          ColumnPath col = new ColumnPath(tableName);    
  79.          col.setColumn(ColumnName.getBytes());   
  80.            
  81.          /* 执行插入操作,指定keysapce, row, col, 和数据内容, 后面两个参数一个是timestamp, 另外一个是consistency_level  
  82.           * timestamp是用来做数据一致性保证的, 而consistency_level是用来控制数据分布的策略,前者的理论依据是bigtable, 后者的理论依据是dynamo  
  83.           */    
  84.         cassandraClient.insert(keyspace, row, col,"i don't know".getBytes(), System.currentTimeMillis(), ConsistencyLevel.ONE);  
  85.      }  
  86.        
  87.      /** 
  88.       * 删除记录 
  89.       */  
  90.      public static void delete(String tableSpace,String tableName, String rowParam,String ColumnName,long timeStamp)   
  91.         throws TException, TimedOutException, InvalidRequestException, UnavailableException, NotFoundException{  
  92.          /* 选择需要操作的Keyspaces, 存放数据表所在的空间位置 */    
  93.          String keyspace= tableSpace;  
  94.          /* 数据所在的行标 */  
  95.          String row = rowParam;    
  96.      
  97.          /* 创建一个column path */    
  98.          ColumnPath col = new ColumnPath(tableName);    
  99.          col.setColumn(ColumnName.getBytes());   
  100.            
  101.          /* 执行删除操作,指定keysapce, row, col, 后面两个参数一个是timestamp, 另外一个是consistency_level  
  102.           * timestamp是用来做数据一致性保证的, 而consistency_level是用来控制数据分布的策略,前者的理论依据是bigtable, 后者的理论依据是dynamo  
  103.           */    
  104.         cassandraClient.remove(keyspace, row, col, System.currentTimeMillis(), ConsistencyLevel.ONE);  
  105.      }  
  106.        
  107.      /**  
  108.       * 获取数据  
  109.       */  
  110.      public static Column getByColumn(String tableSpace,String tableName, String rowParam,String ColumnName,long timeStamp)   
  111.     throws TException, TimedOutException, InvalidRequestException, UnavailableException, NotFoundException{  
  112.       /* 选择需要操作的Keyspaces, 存放数据表所在的空间位置 */    
  113.       String keyspace= tableSpace;   
  114.       /* 数据所在的行标 */  
  115.       String row = rowParam;    
  116.   
  117.       /* 创建一个column path */    
  118.       ColumnPath col = new ColumnPath(tableName);    
  119.       col.setColumn(ColumnName.getBytes());   
  120.         
  121.       /* 执行查询操作,指定keysapce, row, col, timestamp  
  122.        * timestamp是用来做数据一致性保证的, 而consistency_level是用来控制数据分布的策略,前者的理论依据是bigtable, 后者的理论依据是dynamo  
  123.        */    
  124.       Column column = cassandraClient.get(keyspace, row, col, ConsistencyLevel.ONE).column;    
  125.       return column;  
  126.      }  
  127.        
  128.        
  129.      /** 
  130.       * 关闭当前的远程访问连接 
  131.       */  
  132.      public static void close() {  
  133.          socket.close();  
  134.     }  
  135.  }    

为了比较好的理解这些名词解释,我们先看看cassandra的数据模型:


Cassandra 的数据模型的基本概念:
keyspace:
用于存放 ColumnFamily 的容器,相当于关系数据库中的 Schema 或 database,
ColumnFamily :
用于存放 Column 的容器,类似关系数据库中的 table 的概念。

SuperColumn :
它是一个特列殊的 Column, 它的 Value 值可以包函多个 Column
Java代码
  1. {   // 这是一个SuperColumn  
  2.     name: "李明杰",  
  3.    // 包含一系列的Columns  
  4.    value: {  
  5.     street: {name: "street", value: "1234 x street", timestamp: 123456789},  
  6.     city: {name: "city", value: "san francisco", timestamp: 123456789},  
  7.     zip: {name: "zip", value: "94107", timestamp: 123456789},  
  8.    }  
  9. }  

Columns:
Cassandra 的最基本单位。由 name , value , timestamp 组成
Java代码
  1. {  // 这是一个column  
  2.   name: "李明杰",  
  3.   value: "mydream.limj@gmali.com",  
  4.   timestamp: 123456789  
  5. }   


cassandra的数据模型主要就是由上述几种模型构建而成的,很简单吧,的确是这样,最大的好处就是读写数据的API非常简单.
  • 大小: 11.5 KB
  • 查看图片附件