دسته: سایر
فرمت فایل: doc
حجم فایل: 89 کیلوبایت
تعداد صفحات فایل: 9
افزایش کارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مکعب مفهومی به فضای دوبعدی
چکیده
پایگاه داده تحلیلی و پردازش تحلیلی برخط، از جمله عناصر ضروری در سیستمهای تصمیمیار به شمار میروند که به طور روز افزون در مباحث مرتبط با پایگاههای داده مورد توجه قرار گرفتهاند. سیستمهای تصمیمیار نسبت به سیستمهای پردازش تراکنش برخط، نیازمندیهای متفاوتی دارد. در این سیستمها بهینهسازی پرسوجوها و پردازش کارآی مکعب های دادهای نقش اساسی در عملکرد سیستم ایفا میکند.
در این مقاله با به کارگیری تکنیکهای محاسبه از پایین به بالای عناصر شبکه جستجو، روش کارآیی برای پردازش پرسوجو در پایگاه داده تحلیلی و انجام محاسبات مکعب داده ارائه شده است. بررسی نتایج به دست آمده بر مبنای پارامترهای ارزیابی، حکایت از آن دارد که الگوریتم ارائه شده در این مقاله نسبت به بهترین الگوریتمهایی که پیش از آن ارائه شدهاند عملکرد بهتری (بر اساس معیار زمان اجرا) از خود نشان میدهد و سرعت آن در اجرای پرس و جوهای یکنوا و با حجم داده های بسیار زیاد، به مراتب بهتر از الگوریتم های پیش از آن است. ضمن اینکه با توجه به نگاه دو بعدی ایجاد شده توسط این الگوریتم به مساله مکعب و تبدیل مکعب به ساختار ابرگراف، میزان حافظه مورد نیاز این الگوریتم در مواردی که مجموع سازی بر روی زیرمجموعهای از ابعاد مکعب صورت پذیرد، کمتر از حافظهی مصرف شده توسط الگوریتمهای پیش از آن است.
کلید واژه:
مکعب داده
پایگاه داده تحلیلی
پردازش تحلیلی برخط
مدل دادهی چند بعدی
1- مقدمه
پایگاه دادهی تحلیلی، ابزاری برای پشتیبانی تصمیم است که از منابع دادهی سازمانها و ارگانهای متفاوت تهیه میشود. این پایگاه داده بستر مناسبی فراهم میآورد که دادههای بایگانی شده در پایگاههای دادهی عملیاتی، به صورت مجتمع و سازمان یافته درآیند و برای استخراج دانش مناسب باشند. تعریف ارائه شده توسط اینمون (Inmon) برای پایگاه داده تحلیلی به صورت زیر است: “پایگاه داده تحلیلی، یک مجموعه موضوع-گرا، یکپارچه، متکی بر بازههای زمانی متفاوت (متغیر با زمان) ، و تغییرناپذیر از دادهها است که برای پشتیبانی مدیریت پردازش تصمیمگیری (تصمیمیاری) به کار میرود.”[12]
پایگاههای داده تحلیلی با توجه به اینکه اطلاعات مجتمع شده از چندین پایگاه داده عملیاتی را در خود دارند شامل حجم عظیمی از داده هستند. این مساله سبب بروز مشکلاتی در نگهداری و به کارگیری پایگاههای مزبور میشود. برای اینکه بتوان به صورت کارا به پرسوجوهایی که از پایگاه داده تحلیلی میشود پاسخ داد، باید از روشهایی کارا برای دستیابی به داده و پردازش پرسوجو استفاده کرد. به این منظور الگوریتمهای فراوانی ارائه شدهاند که هدف آنها انجام پرس و جوها به نحوی است که زمان لازم برای پاسخگویی کمینه باشد و در عین حال فضای حافظه مورد نیاز برای انجام پردازش ها بهینه و یا دست کم قابل قبول باشد.
پایگاه های داده تحلیلی را می توان از دیدگاه مفهومی به صورت مجموعه ای چند بعدی از داده ها دید. این دیدگاه چند بعدی را مکعب داده می نامند. مکعب داده در [6] ارائه شده و برخی از ویژگیهای مفید محاسبه مکعب بیان شده است. منظور از محاسبه مکعب داده، پاسخگویی به پرس و جوهای تحلیلی است که از پایگاه داده تحلیلی متناظر با آن می شود. چون این پرس وجوها تحلیلی هستند و به بررسی داده ها در بعد کلان می پردازند، نیاز به مجموع سازی داده ها در ابعاد مختلف مکعب دارند.سه نوع تابع برای انجام عملیات مجموعسازی تعریف میشوند [1]. مجموعهای مانند T از چندگانهها (رکوردها) را در نظر بگیرید. فرض کنید که مجموعهی یک مجموعهی کامل از زیر مجموعههای جدا از هم T باشد یعنی و .
• تابع مجموعساز F، تابع توزیعی خوانده میشود اگر تابعی مانند G وجود داشته باشد طوریکه . توابع SUM، MIN، و MAX همگی توابعی توزیعی هستند که در آنها G=F است. تابع COUNT نیز یک تابع توزیعی است که در آن G=SUM است.
• تابع مجموعساز F جبری است اگر تابع M-مقداری G و تابع H موجود باشند طوریکه که در آن مقدار M برخلاف مقادیر |T| و n ثابت است. همهی تابعهای توزیعی توابعی جبری نیز هستند. علاوه بر آنها توابعی نظیر میانگین، انحراف معیار استاندارد، MaxN و MinN نیز توابعی جبری هستند. به عنوان مثال، در تابع میانگین (Average)، تابع G مقادیر SUM و COUNT را به دست میآورد و تابع H نتایج به دست آمده از تابع G را بر هم تقسیم مینماید.
• یک تابع مجموعساز نظیر F را هولیستیک مینامند اگر جبری نباشد. برای مثال توابع میانه (Median) و رتبه (Rank) نمونهای از توابع هولیستیک هستند.
فهرست مطالب
افزایش کارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مکعب مفهومی به فضای دوبعدی 1
چکیده 1
کلید واژه 1
1- مقدمه 2
2- پرس و جوهای آستانه ای 3
3- الگوریتم Ex-Cube 5
3-1- تعاریف و نمادها 5
3-2- ساختار ابرگراف 6
3-3- ذخیره سازی دوبعدی Ex-Graph 6
3-4- فضای لازم برای ذخیره سازی Ex-Graph 7
4- شبیهسازی و نتایج به دست آمده 8
4-1- تاثیر افزایش حجم پایگاه داده بر روی شمای ثابت بر سرعت محاسبات 8
4-2- تغییرات زمان با افزایش کاردینالیتی ابعاد 8
4-3- افزایش تعداد ابعاد 8
4-4- افزایش تعداد ابعاد 9
5- نتیجه 9
مراجع 9
OLAP
Data Cube
Data Warehouse
On-Line Analytical Processing
Multi-dimensional Data Model
قیمت فایل فقط 6,000 تومان برچسب ها :