Hbase 列族的设计的原则 ?

HBase列族的设计原则主要包括以下几点:

  1. 尽可能少地设计列族。按照列族进行存储,按照region进行读取,不必要的IO操作应该避免。同时,经常和不经常使用的两类数据应该放入不同的列族中。
  2. 列族应该具有相似的访问模式。将具有相似访问模式的列放在同一个列族中,可以提高数据的访问效率,避免不必要的IO操作。
  3. 列族名字应该尽可能短。虽然这不是一个硬性的规定,但是短的列族名可以减少存储和读取时的开销。

另外,需要注意的是,大多数表设计一个列族就够了。在HBase中,高表(即列数较多的表)比宽表(即行数较多的表)性能好,可以设计多张表来满足需求。而且,不建议设计多个列族,因为过多的列族会导致基数问题,进而降低扫描列族的性能。

以上原则都是为了优化HBase的性能和效率。根据具体的应用场景和需求,可以灵活调整列族的设计策略。

发表评论

后才能评论