
データレイク:ビッグデータ時代の新しい情報管理
- データレイクとはデータレイクは、様々な場所から集めたデータを、そのままの形で集めて保管しておく巨大なデータ置き場のことです。顧客情報や売上データ、ウェブサイトのアクセス記録、センサーデータなど、種類の異なるデータでも、集めてきたままの形で保存します。まるで、色々な種類の魚が集まる大きな湖のように、様々な形式のデータが集められる場所であることから、データレイクと呼ばれています。従来のデータベースでは、集めたデータを分析して整理してから保存していました。しかし、データレイクでは、生のデータを、手を加えずにそのままの形で保存することが特徴です。これは、近年のデータ量の増加と、データ分析技術の高度化が背景にあります。従来のように、必要なデータだけを選別して保存していては、後から必要になったデータがなかった、という事態が発生する可能性があります。また、人工知能の機械学習など、大量のデータを使って分析する技術では、生のデータこそが価値を持つとされています。データレイクは、このような膨大なデータの可能性を最大限に引き出すために有効な手段と言えるでしょう。