読者です 読者をやめる 読者になる 読者になる

Apache Cassandraプロジェクトのトップページを訳してみよう

Apache Cassandraプロジェクトのトップページ(2010年3月15日時点)に書いてあることを適当に訳してみた。間違ってたら教えてください。翻訳することに慣れてないので勉強になります。
文中に「結果整合性」とか「不整合ウィンドウ」とかいう用語が出てきますが、そのあたりはEventuallyConsistent - (corrupted, sorry)を読むと幸せになれるかも。私もこの文章翻訳するまで知りませんでした。

Welcome to Apache Cassandra

Apache Cassandraプロジェクトは、Amazon Dynamoの完全な分散設計とBigTableの列指向データモデルを合わせたハイスケーラビリティな第2世代の分散データベースを開発しています。
Cassandraは2008年にFacebookオープンソース化し、現在はApacheのコミッターと様々な企業から参加しているコントリビューターによって開発されています。

Overview

Proven(事例)

CassandraはDiggFacebookTwitterReddit、Rackspace、Cloudkick、Cisco、SimpleGeo、Ooyala、OpenXなど、大量のデータを扱っている多くの企業で使われています。最大規模の商用クラスタは150台以上のノードで100TB以上のデータを扱っています。

Fault Tolerant(耐障害性)

耐障害性を実現するために、データは自動的に複数のノードへレプリケーションされます。複数データセンター間のレプリケーションをサポートしています。障害の発生したノードはシステムを停止せずに入れ替えることができます。

Decentralized(分散)

クラスタ上の全ノードは完全に同一格です。ネットワークボトルネック箇所は存在しません。単一障害点は存在しません。

Consistent, Eventually(結果整合性)

Cassandraは結果整合性モデルを実装し、洗練された特徴(例えば不整合ウィンドウを最小化するHinted HandoffとRead Repair)を持っています。

Rich Data Model(リッチデータモデル)

多くのアプリケーションではシンプルなkey/valueよりも効率的です。

Elastic(弾力的)

Read/Writeスループットは新しいノードを追加することで線形に増加します。その際のシステム停止やアプリケーションへの割り込みはありません。

Highly Availabile(高可用性)

Read/Write処理は「とりあえず書き込みに成功した*1」から「全レプリカデータが読み込み可能な状態になった」の間で設定可能なConsistencyLevelを常に提供します。

*1:原文では"writes never fail"