تعریف انبار داده (یادآوری): انبار داده (اغلب به اختصار DW یا DWH نامیده می شود) یک مخزن داده مرکزی است که برای گزارش گیری و تجزیه و تحلیل داده ها استفاده می شود. می تواند به چندین منبع داده متصل شده و یکپارچه شود تا یک ناحیه مشترک برای ایجاد بینش کسب و کار ایجاد کند.
انبار داده به عنوان یک مخزن مرکزی عمل می کند که در آن اطلاعات از منابع مختلف به دست می آید. پس از ورود به انبار داده، داده ها جذب، تبدیل، پردازش شده و برای استفاده در تصمیم گیری در دسترس قرار می گیرند.
سه نوع اصلی انبارهای داده عبارتند از: انبار داده سازمانی (EDW)، پایگاه داده تحلیلی (ODS) و بازار داده- دیتا مارت data mart.
1.انبار داده سازمانی (EDW) یک انبار متمرکز است که خدمات پشتیبانی تصمیم را در سراسر سازمان ارائه می دهد. EDW ها معمولا مجموعه ای از پایگاه های داده هستند که یک رویکرد واحد برای سازماندهی داده ها و طبقه بندی داده ها بر اساس موضوع ارائه می دهند (انبار داده سازمانی (EDW) یک انبار داده رابطه ای است که حاوی داده های تجاری یک شرکت، از جمله اطلاعات مربوط به مشتریان آن است). انبار داده سازمانی (EDW) یک پایگاه داده یا مجموعه ای از پایگاه های داده است که اطلاعات یک کسب و کار را از منابع و برنامه های متعدد متمرکز می کند و آن را برای تجزیه و تحلیل و استفاده در سراسر سازمان در دسترس قرار می دهد. EDW ها را می توان در یک سرور داخلی یا در فضای ابری قرار داد.
دادههای ذخیرهشده در این نوع انبار دیجیتال میتواند یکی از با ارزشترین داراییهای یک کسبوکار باشد، زیرا نشاندهنده بسیاری از چیزهایی است که در مورد کسبوکار، کارمندان، مشتریان آن و موارد دیگر شناخته شده است.
2.پایگاه داده تحلیلی (ODS) یک پایگاه داده مرکزی است که دیدی فوری از آخرین داده ها از چندین سیستم تراکنش برای گزارش عملیاتی ارائه می دهد. و سازمان ها را قادر می سازد تا داده ها را در قالب اصلی خود از منابع مختلف در یک مقصد واحد ترکیب کنند تا آن ها را برای گزارش های تجاری در دسترس قرار دهند.
یک ODS حاوی اطلاعات به روز است که از منابع عملیاتی یکپارچه شده است و از ابزارهای هوش تجاری (BI) پشتیبانی می کند که به تصمیم گیری تاکتیکی کمک می کند. به عنوان مثال، یک مدیر میتواند یک ODS راهاندازی کند تا دستهای از دادههای هفتگی را از یک برنامه صورتحساب بهروزرسانی کند، سوابق تراکنشهای فردی را همانطور که در پایگاهداده فروش رخ میدهنددریافت کند، سپس هر دو را در جدولهای رابطهای جدید ترکیب کند. بنابراین، پرس و جو و گزارش در مورد داده های عملیاتی در یک ODS با تضمینی همراه است که این جداول یکپارچه حاوی جدیدترین دید فوری مرتبط با شرکت هستند.
3.دیتا مارت (دیتا مارت شکل ساده ای از انبار داده است) زیرمجموعه ای از انبار داده در نظر گرفته می شود و معمولاً به یک تیم یا خط تجاری خاص مانند امور مالی یا فروش متمرکز می شود. موضوع محور است، داده های خاص را سریعتر در اختیار گروهی مشخص از کاربران قرار می دهد و بینش های مهمی را در اختیار آنها قرار می دهد. در دسترس بودن داده های خاص تضمین می کند که آنها نیازی به هدر دادن زمان برای جستجو در کل انبار داده ندارند.
چرا دیتا مارت ها ساخته می شوند؟ دیتا مارت دسترسی آسانتری به دادههای مورد نیاز یک تیم یا خط کسبوکار خاص در سازمان شما را فراهم میکند. به عنوان مثال، اگر تیم بازاریابی شما به دنبال داده هایی برای کمک به بهبود عملکرد کمپین در طول فصل تعطیلات است، غربال کردن و ترکیب داده های پراکنده در چندین سیستم می تواند از نظر زمان، دقت و در نهایت پول پرهزینه باشد.
تیم هایی که مجبور به مکان یابی داده ها از منابع مختلف هستند، اغلب برای اشتراک گذاری این داده ها و همکاری به صفحات گسترده متکی هستند. این معمولاً منجر به خطاهای انسانی، سردرگمی، آشتی های پیچیده و منابع متعدد حقیقت می شود - به اصطلاح "کابوس صفحه گسترده". دیتا مارت ها به عنوان یک مکان متمرکز که در آن داده های لازم قبل از ایجاد گزارش ها، داشبوردها و تجسم ها جمع آوری و سازماندهی می شوند، محبوب شده اند.
تفاوت بین (data marts, data lakes, and data warehouses) چیست؟
انبار داده یک سیستم مدیریت داده است که برای پشتیبانی از هوش تجاری و تجزیه و تحلیل برای کل سازمان طراحی شده است. انبارهای داده اغلب حاوی مقادیر زیادی داده از جمله داده های تاریخی هستند. دادههای یک انبار داده معمولاً از طیف گستردهای از منابع، مانند فایلهای گزارش برنامهها و برنامههای کاربردی تراکنش گرفته میشوند. یک انبار داده، داده های ساختاریافته را ذخیره می کند که هدف آنها معمولاً به خوبی تعریف شده است.
دریاچه داده به سازمانها اجازه میدهد تا مقادیر زیادی از دادههای ساختاریافته و بدون ساختار را ذخیره کنند (به عنوان مثال، از رسانههای اجتماعی یا دادههای جریان کلیک)، و فوراً آن را برای تجزیه و تحلیل بلادرنگ، علم داده و موارد استفاده از یادگیری ماشین در دسترس قرار دهند. با یک دریاچه داده، داده ها به شکل اصلی خود، بدون تغییر خورده می شوند.
تفاوت اصلی بین دریاچه داده و انبار داده در این است که دریاچه های داده مقادیر زیادی داده خام را بدون ساختار از پیش تعریف شده ذخیره می کنند. سازمان ها نیازی ندارند از قبل بدانند که چگونه از داده ها استفاده خواهد شد.
دیتا مارت شکل ساده ای از انبار داده است که بر یک موضوع یا رشته تجاری واحد مانند فروش، امور مالی یا بازاریابی متمرکز است. با توجه به تمرکزشان، دیتامارت ها داده ها را از منابع کمتری نسبت به انبارهای داده استخراج می کنند. منابع مارت داده می توانند شامل سیستم های عملیاتی داخلی، انبار داده مرکزی و داده های خارجی باشند.
انبار داده برای چه مواردی استفاده می شود؟
خطوط هوایی:
در سیستم هواپیمایی، برای اهداف عملیاتی مانند تخصیص خدمه، تجزیه و تحلیل سودآوری مسیر، تبلیغات برنامه پروازهای مکرر و غیره استفاده می شود.
بانکداری:
به طور گسترده ای در بخش بانکداری برای مدیریت موثر منابع موجود روی میز استفاده می شود. تعداد کمی از بانک ها نیز برای تحقیقات بازار، تجزیه و تحلیل عملکرد محصول و عملیات استفاده می کنند.
مراقبت های بهداشتی:
بخش مراقبت های بهداشتی همچنین از انبار داده برای استراتژی و پیش بینی نتایج، تولید گزارش های درمان بیمار، به اشتراک گذاری داده ها با شرکت های بیمه ای، خدمات کمک پزشکی و غیره استفاده می کند.
بخش عمومی:
در بخش عمومی از انبار داده برای جمع آوری اطلاعات استفاده می شود. این به سازمانهای دولتی کمک میکند تا سوابق مالیاتی، سوابق سیاستهای سلامت را برای هر فرد حفظ و تجزیه و تحلیل کنند.
بخش سرمایه گذاری و بیمه:
در این بخش، انبارها عمدتاً برای تجزیه و تحلیل الگوهای داده ها، روندهای مشتری و ردیابی حرکات بازار استفاده می شوند.
زنجیره نگهدارنده:
در زنجیره های خرده فروشی، انبار داده به طور گسترده ای برای توزیع و بازاریابی استفاده می شود. همچنین به ردیابی اقلام، الگوی خرید مشتری، تبلیغات کمک می کند و همچنین برای تعیین سیاست قیمت گذاری استفاده می شود.
مخابرات:
یک انبار داده در این بخش برای تبلیغات محصول، تصمیمات فروش و تصمیم گیری در مورد توزیع استفاده می شود.
صنعت هتلداری:
این صنعت از خدمات انبار برای طراحی و همچنین برآورد کمپین های تبلیغاتی و تبلیغاتی خود در جایی که می خواهند مشتریان را بر اساس بازخورد و الگوهای سفر آنها هدف قرار دهند، استفاده می کند.
منبع اول، منبع دوم، منبع سوم، منبع چهارم, منبع پنجم، منبع ششم، منبع هفتم، منبع هشتم
مدرس: ملیحه باغبان، دانشجوی دکتری علم اطلاعات ودانش شناسی/ بازیابی اطلاعات و دانش
این مبحث برای دانشجویان علم اطلاعات و دانش شناسی گردآوری و ارائه می گردد