جستجو

آرشيو مطالب

تعریف انبار داده (یادآوری): انبار داده (اغلب به اختصار DW یا DWH نامیده می شود) یک مخزن داده مرکزی است که برای گزارش گیری و تجزیه و تحلیل داده ها استفاده می شود. می تواند به چندین منبع داده متصل شده و یکپارچه شود تا یک ناحیه مشترک برای ایجاد بینش کسب و کار ایجاد کند.

انبار داده به عنوان یک مخزن مرکزی عمل می کند که در آن اطلاعات از منابع مختلف به دست می آید. پس از ورود به انبار داده، داده ها جذب، تبدیل، پردازش شده و برای استفاده در تصمیم گیری در دسترس قرار می گیرند.

سه نوع اصلی انبارهای داده عبارتند از: انبار داده سازمانی (EDW)، پایگاه داده تحلیلی (ODS) و بازار داده- دیتا مارت data mart.

1.انبار داده سازمانی (EDW) یک انبار متمرکز است که خدمات پشتیبانی تصمیم را در سراسر سازمان ارائه می دهد. EDW ها معمولا مجموعه ای از پایگاه های داده هستند که یک رویکرد واحد برای سازماندهی داده ها و طبقه بندی داده ها بر اساس موضوع ارائه می دهند (انبار داده سازمانی (EDW) یک انبار داده رابطه ای است که حاوی داده های تجاری یک شرکت، از جمله اطلاعات مربوط به مشتریان آن است). انبار داده سازمانی (EDW) یک پایگاه داده یا مجموعه ای از پایگاه های داده است که اطلاعات یک کسب و کار را از منابع و برنامه های متعدد متمرکز می کند و آن را برای تجزیه و تحلیل و استفاده در سراسر سازمان در دسترس قرار می دهد. EDW ها را می توان در یک سرور داخلی یا در فضای ابری قرار داد.

داده‌های ذخیره‌شده در این نوع انبار دیجیتال می‌تواند یکی از با ارزش‌ترین دارایی‌های یک کسب‌وکار باشد، زیرا نشان‌دهنده بسیاری از چیزهایی است که در مورد کسب‌وکار، کارمندان، مشتریان آن و موارد دیگر شناخته شده است.

2.پایگاه داده تحلیلی (ODS) یک پایگاه داده مرکزی است که دیدی فوری از آخرین داده ها از چندین سیستم تراکنش برای گزارش عملیاتی ارائه می دهد. و سازمان ها را قادر می سازد تا داده ها را در قالب اصلی خود از منابع مختلف در یک مقصد واحد ترکیب کنند تا آن ها را برای گزارش های تجاری در دسترس قرار دهند.

یک ODS حاوی اطلاعات به روز است که از منابع عملیاتی یکپارچه شده است و از ابزارهای هوش تجاری (BI) پشتیبانی می کند که به تصمیم گیری تاکتیکی کمک می کند. به عنوان مثال، یک مدیر می‌تواند یک ODS راه‌اندازی کند تا دسته‌ای از داده‌های هفتگی را از یک برنامه صورت‌حساب به‌روزرسانی کند، سوابق تراکنش‌های فردی را همانطور که در پایگاه‌داده فروش رخ می‌دهنددریافت کند، سپس هر دو را در جدول‌های رابطه‌ای جدید ترکیب کند. بنابراین، پرس و جو و گزارش در مورد داده های عملیاتی در یک ODS با تضمینی همراه است که این جداول یکپارچه حاوی جدیدترین دید فوری مرتبط با شرکت هستند.

3.دیتا مارت (دیتا مارت شکل ساده ای از انبار داده است) زیرمجموعه ای از انبار داده در نظر گرفته می شود و معمولاً به یک تیم یا خط تجاری خاص مانند امور مالی یا فروش متمرکز می شود. موضوع محور است، داده های خاص را سریعتر در اختیار گروهی مشخص از کاربران قرار می دهد و بینش های مهمی را در اختیار آنها قرار می دهد. در دسترس بودن داده های خاص تضمین می کند که آنها نیازی به هدر دادن زمان برای جستجو در کل انبار داده ندارند.

چرا دیتا مارت ها ساخته می شوند؟ دیتا مارت دسترسی آسان‌تری به داده‌های مورد نیاز یک تیم یا خط کسب‌وکار خاص در سازمان شما را فراهم می‌کند. به عنوان مثال، اگر تیم بازاریابی شما به دنبال داده هایی برای کمک به بهبود عملکرد کمپین در طول فصل تعطیلات است، غربال کردن و ترکیب داده های پراکنده در چندین سیستم می تواند از نظر زمان، دقت و در نهایت پول پرهزینه باشد.

تیم هایی که مجبور به مکان یابی داده ها از منابع مختلف هستند، اغلب برای اشتراک گذاری این داده ها و همکاری به صفحات گسترده متکی هستند. این معمولاً منجر به خطاهای انسانی، سردرگمی، آشتی های پیچیده و منابع متعدد حقیقت می شود - به اصطلاح "کابوس صفحه گسترده". دیتا مارت ها به عنوان یک مکان متمرکز که در آن داده های لازم قبل از ایجاد گزارش ها، داشبوردها و تجسم ها جمع آوری و سازماندهی می شوند، محبوب شده اند.

انواع دیتا مارت:
سه نوع داده مارت وجود دارد: وابسته، مستقل (از جای دیگر داده نمی گیرند) و ترکیبی (دیجی کالا مقداری داده مستقل دارد و مقداری را از فروشندگان می گیرد). آنها بر اساس ارتباط آنها با انبار داده و منابع داده ای که برای ایجاد سیستم استفاده می شوند، دسته بندی می شوند. یک دیتا مارت وابسته از یک انبار داده سازمانی موجود ایجاد می شود.

تفاوت بین (data marts, data lakes, and data warehouses) چیست؟

انبار داده یک سیستم مدیریت داده است که برای پشتیبانی از هوش تجاری و تجزیه و تحلیل برای کل سازمان طراحی شده است. انبارهای داده اغلب حاوی مقادیر زیادی داده از جمله داده های تاریخی هستند. داده‌های یک انبار داده معمولاً از طیف گسترده‌ای از منابع، مانند فایل‌های گزارش برنامه‌ها و برنامه‌های کاربردی تراکنش گرفته می‌شوند. یک انبار داده، داده های ساختاریافته را ذخیره می کند که هدف آنها معمولاً به خوبی تعریف شده است.

دریاچه داده به سازمان‌ها اجازه می‌دهد تا مقادیر زیادی از داده‌های ساختاریافته و بدون ساختار را ذخیره کنند (به عنوان مثال، از رسانه‌های اجتماعی یا داده‌های جریان کلیک)، و فوراً آن را برای تجزیه و تحلیل بلادرنگ، علم داده و موارد استفاده از یادگیری ماشین در دسترس قرار دهند. با یک دریاچه داده، داده ها به شکل اصلی خود، بدون تغییر خورده می شوند.

تفاوت اصلی بین دریاچه داده و انبار داده در این است که دریاچه های داده مقادیر زیادی داده خام را بدون ساختار از پیش تعریف شده ذخیره می کنند. سازمان ها نیازی ندارند از قبل بدانند که چگونه از داده ها استفاده خواهد شد.

دیتا مارت شکل ساده ای از انبار داده است که بر یک موضوع یا رشته تجاری واحد مانند فروش، امور مالی یا بازاریابی متمرکز است. با توجه به تمرکزشان، دیتامارت ها داده ها را از منابع کمتری نسبت به انبارهای داده استخراج می کنند. منابع مارت داده می توانند شامل سیستم های عملیاتی داخلی، انبار داده مرکزی و داده های خارجی باشند.

انبار داده برای چه مواردی استفاده می شود؟

خطوط هوایی:

در سیستم هواپیمایی، برای اهداف عملیاتی مانند تخصیص خدمه، تجزیه و تحلیل سودآوری مسیر، تبلیغات برنامه پروازهای مکرر و غیره استفاده می شود.

بانکداری:

به طور گسترده ای در بخش بانکداری برای مدیریت موثر منابع موجود روی میز استفاده می شود. تعداد کمی از بانک ها نیز برای تحقیقات بازار، تجزیه و تحلیل عملکرد محصول و عملیات استفاده می کنند.

مراقبت های بهداشتی:

بخش مراقبت های بهداشتی همچنین از انبار داده برای استراتژی و پیش بینی نتایج، تولید گزارش های درمان بیمار، به اشتراک گذاری داده ها با شرکت های بیمه ای، خدمات کمک پزشکی و غیره استفاده می کند.

بخش عمومی:

در بخش عمومی از انبار داده برای جمع آوری اطلاعات استفاده می شود. این به سازمان‌های دولتی کمک می‌کند تا سوابق مالیاتی، سوابق سیاست‌های سلامت را برای هر فرد حفظ و تجزیه و تحلیل کنند.

بخش سرمایه گذاری و بیمه:

در این بخش، انبارها عمدتاً برای تجزیه و تحلیل الگوهای داده ها، روندهای مشتری و ردیابی حرکات بازار استفاده می شوند.

زنجیره نگهدارنده:

در زنجیره های خرده فروشی، انبار داده به طور گسترده ای برای توزیع و بازاریابی استفاده می شود. همچنین به ردیابی اقلام، الگوی خرید مشتری، تبلیغات کمک می کند و همچنین برای تعیین سیاست قیمت گذاری استفاده می شود.

مخابرات:

یک انبار داده در این بخش برای تبلیغات محصول، تصمیمات فروش و تصمیم گیری در مورد توزیع استفاده می شود.

صنعت هتلداری:

این صنعت از خدمات انبار برای طراحی و همچنین برآورد کمپین های تبلیغاتی و تبلیغاتی خود در جایی که می خواهند مشتریان را بر اساس بازخورد و الگوهای سفر آنها هدف قرار دهند، استفاده می کند.

انباره داده ها - کاربران
کاربران اصلی انبار داده به چهار دسته تقسیم می شوند:
1. تحلیلگران: آمارگیران - معمولاً تعداد انگشت شماری از تحلیلگران ماهر، در هر سازمانی وجود دارد. این افراد بسیار خودکفا هستند و فقط باید به پایگاه داده اشاره کنند و دستورالعمل های ساده ای در مورد نحوه دستیابی به اطلاعات و اینکه چه ساعاتی از روز برای اجرای پرس و جوهای بزرگ برای بازیابی داده ها برای تجزیه و تحلیل با استفاده از ابزارهای پیچیده آنها بهترین است، به آنها داده شود. 
2.تولید کنندگان برنامه های کاربردی - تعداد نسبتاً کمی از تحلیلگران تعداد پرس و جوها و تحلیل های جدید را در مقابل انبار داده پیاده سازی می کنند. اینها کاربرانی هستند که نسخه «طراح» یا «تحلیلگر» ابزارهای دسترسی کاربر را دارند. پرس و جوها و اسناد آنها به طور کلی به نفع مصرف کنندگان اطلاعات منتشر می شود. تولید کنندگان برنامه های کاربردی اغلب به شدت با طراحی انبار داده درگیر هستند و بالاترین تقاضاها را برای آموزش و پشتیبانی به تیم عملیات انبار داده در حال انجام می‌دهند.
3.مصرف کنندگان اطلاعات - برخی از کاربران انبار داده مصرف کنندگان اطلاعات هستند و احتمالاً هرگز یک پرس و جو موقت معتبر ایجاد نخواهند کرد. آنها از اسناد استاتیک یا ساده تعاملی استفاده می کنند که توسعه یافته اند. فراموش کردن این کاربران ساده است زیرا آنها عموماً تنها از طریق محصول کاری دیگران با انبار داده ارتباط برقرار می کنند.
4.مدیران - مدیران یک مورد خاص از گروه مصرف کنندگان اطلاعات هستند. برخی از مدیران پرس و جوهای خود را مطرح می کنند، اما کوچکترین تعمق یک مدیر می تواند فعالیت های زیادی را بین انواع دیگر کاربران ایجاد کند.
در یک سیستم به چه چیزهایی باید توجه شود؟ (دکتر امیر غائبی)
1.ورودی سیستم چیست؟
2.چه پردازشی بر روی آن انجام می شود؟
3.چه خروجی دارد؟
4. برای چه کسانی ساخته شده است؟
لینک منابع:

منبع اول، منبع دوم، منبع سوم، منبع چهارم, منبع پنجم، منبع ششم، منبع هفتم، منبع هشتم

مدرس: ملیحه باغبان، دانشجوی دکتری علم اطلاعات ودانش شناسی/ بازیابی اطلاعات و دانش

این مبحث برای دانشجویان علم اطلاعات و دانش شناسی گردآوری و ارائه می گردد


دوشنبه 03 آبان 1400
ادامه مطلب
درباره نویسنده
ملیحه باغبان

📖  کارشناسی کتابداری
دانشگاه پیـــام نور مرکز تبریز

📖  کارشناسی ارشد
مدیریت اطلاعات دانشگاه تبریز

📖  دانشجوی دکتری
بازیـــابی اطـلاعــات و دانــــش
دانشگـــاه الـزهرا (س) - تهران