masayh: 某社の基幹バッチをHadoopで高速化する方法。思ったより性能が出ないのは、HDFSを使うからです。基幹バッチ固有の関係モデルを前提としてRDBを分散で使えば、多分相当の性能が出るはず。もちろん、Hadoopのストレージ層として。某社が技術に挑戦するなら、そこまで進むべきと思う。
↧