یکپارچه سازی و مدیریت بازیابی  داده ها در سیستم های Cloud

0
120

چکیده – یکپارچگی داده ها و مدیریت بازیابی مسئله مهمی در Cloud Computing است. یک چالش بزرگ در بازیابی و امنیت اطلاعات وجود دارد. بنابراین لازم است یک سیستم کارآمد و قابل اطمینان در ذخیره سازی داده ها فراهم شود. در این مقاله، روش جدیدی برای بازیابی و مدیریت داده ها با مقیاس پذیری بالا و قابلیت اطمینان برای ارائه سیستم های مبتنی بر Cloud و تشخیص و تحمل خطا، ارائه شده است. ما یک روش تقسیم بندی داده ها با اضافه کردن آدرس Cloud یا مکان های ذخیره سازی Cloud با استفاده از روش tailing ارائه می دهیم. بنابراین بخش از دست رفته هر node معیوب به راحتی در محدوده شناسایی می شود و از node های همسایه پشتیبان تهیه می کند.

یکپارچگی داده ها در Cloud Computing مهمترین مسئله است و ضروری است که مصرف کنندگان  Cloud از ذخیره سازی داده های خود در Cloud اطمینان حاصل کنند. برای امنیت داده ها، به اشتراک گذاری داده ها و مدیریت داده ها، Cloud Computing رسانه ای برای تأمین قابلیت اطمینان و امنیت است. سرعت گسترش داده تقریباً 4 ترابایت در یک دقیقه میباشد. Cloud Computing این نوع ذخیره سازی جریان داده را برای سیستم عامل های قابل اطمینان فراهم می کند. ارائه دهندگان خدمات Cloud باید الگوریتم های بهینه شده ای را برای انتخاب کوتاهترین مسیر، فشرده سازی داده ها به منظور کاهش اندازه داده ها هنگام انتقال و همچنین مدیریت مکان ذخیره سازی Cloud، تضمین و ارائه دهند. بنابراین ارائه دهندگان خدمات Cloud که شرکت های شخص ثالث هستند برای ارائه الگوریتم های بهینه شده قابل اعتماد و کارآمد برای node معیوب در سیستم های Cloud و همچنین اطمینان از بازیابی پشتیبان داده ها در Cloud، یک چالش دارند. اگر داده ها از سیستم های Cloud حذف شوند، بازیابی مجدد از Cloud با استفاده از هر مکانیزم پشتیبان گیری چالش برانگیز است و تعهدات مربوط به از دست دادن داده ها در nodeهای معیوب Cloud را به مصرف کنندگان ارائه می دهد. در اینجا ما سیستم بهبود یافته تشخیص خطا را ارائه می دهیم تا قابلیت اطمینان و مدیریت بازیابی اطلاعات را به مصرف کنندگان ارائه دهیم.

برای ارائه ویژگی های مختلف QoS ارائه دهندگان خدمات یکسان و مختلف شخص ثالث مورد بحث قرار گرفته و همچنین سیستم های مختلف شناسایی خطا مربوط به سیستم های شناسایی و شناسایی خطای فعال و واکنشی ارائه شده است.

BACKGROUND THEORY

اکنون همه شرکتهای تجاری روزانه از خدمات Cloud مختلفی برای افزایش کارایی و بهره وری خود استفاده می کنند، بنابراین تقاضای زیادی برای استفاده از Cloud Computing وجود دارد. یکپارچگی داده ها فرآیند تأیید داده های ذخیره شده در فضای Cloud است. برای ارائه سرویس های Cloud، رضایت مصرف کنندگان در مورد قابلیت اطمینان داده های آنها ضروری است و همچنین می خواهیم در بازه زمانی منظم، یکپارچگی را برای آنها فراهم کنیم. در یکپارچگی داده ها، دسترسی به داده های ذخیره شده در پایگاه را تضمین می کند.

در یکپارچگی داده ها، ارائه تضمین به مصرف کنندگان در مورد داده های آنها نیز یک چالش مهم است و این چالش ها با پیاده سازی الگوریتم ها و تکنیک های کارآمد برای مشتریان اثبات می شود تا امنیت داده ها در فضای Cloud حفظ شود.

مسئله مهم در مورد یکپارچگی داده ها، از دست دادن داده ها است که به این معنی است که کاربران مقدار زیادی داده را ذخیره می کنند و همچنین داده های بسیار مهمی را در فضای Cloud خود ذخیره می کنند و برخی از کاربران ممکن است به طور مکرر دسترسی داشته باشند و برخی دیگر نادر باشند، به این ترتیب، از دست دادن هرگونه داده یا تغییر داده در پایگاه داده بر یکپارچگی داده تأثیر می گذارد.

متدولوژی

معماری سیستم پیشنهادی ما در شکل 1 نشان داده شده است، و با سیستم های طراحی شده تقسیم داده ها به چندین داده فرعی مورد بحث قرار می گیرد و این داده های فرعی با مکان ها یا آدرس ها در مدیریت زیرساخت Cloud تخصیص داده می شوند. تکنیک طراحی شده در این سیستم ها تغییر داده ها و ذخیره داده ها برای اطمینان از پشتیبان گیری اطلاعات از داده های کاربران است و همچنین تعهدی راجع به امنیت داده های کاربر به کاربر ارائه می دهد. به حداقل رساندن عیب node های معیوب Cloud و همچنین حداکثر کاهش مدیریت خرابی با استفاده از یکپارچگی داده ها و به حداقل رساندن تلفات داده از جمله وظایف این سیستم است.

شکل 1: تحمل خطا و طراحی سیستم بازیابی

فایلها یا اسکریپت های کاربر با بررسی روش های مختلف احراز هویت بارگذاری می شوند و همچنین داده های فایل را بررسی می کنند تا فرمت های پرونده ناخواسته یا پشتیبانی شده برای بارگذاری در Cloud رد شوند. پس از آن، فرآیند اولیه پیش پردازش آغاز می شود و مجموعه ای از مراحل برای پاکسازی داده های کاربر برداشته می شود. بعداً استخراج صفات فایل ها انجام می شود و فایل ها بر اساس مجوزها، نوع مالکیت، اندازه پرونده و تاریخ بارگذاری پرونده ها استخراج می شوند. مرحله بعدی پس از استخراج داده ها تقسیم بندی داده ها است که در اینجا داده ها به داده های زیر Cloud تقسیم می شوند و سپس برای تولید مقادیر دنباله آرایه برای ذخیره داده ها تقسیم و یکپارچه می شوند. در فرآیند داده پردازی، داده های تقسیم شده با اضافه کردن آدرس ها یا مکان های Cloud در انتهای بخش ها، به داده های تقسیم شده اضافه می شوند، سپس داده ها تخصیص داده می شوند و سپس شکاف داده می شوند و بعد از آن یک نسل از آدرس ذخیره سازی ایجاد می شود و در نهایت به روزرسانی پرونده های ورود به سیستم و در نهایت ردیابی داده های Cloud اطمینان حاصل خواهد کرد که هر گونه از دست دادن بخش داده ها به راحتی شناسایی می شود. بنابراین سیستم پیشنهادی قابلیت اطمینان و مقیاس پذیری سفارش بالا را فراهم می کند و سیستم های Cloud را قابل اطمینان تر می کند.

دریافت داده های مختلط از زیرساخت Cloud در این مدل یک چالش است و مدیر داده ها را از مجموعه داده های بهم ریخته بازیابی می کند. مصرف کنندگان داده با ارسال یک سری کلمات کلیدی و سپس پس از احراز هویت مشتری، با ارسال داده های درخواست برای ورود به سیستم، فایل ها را در سیستم cloud پیدا می کنند. مدیر با جستجوی داده ها، فایل درخواست داده را پیدا می کند.

مدیریت تحمل و بازیابی خطاها

مدل پیشنهادی از تغییر داده و افزودن مکان یا آدرسها با افزودن آن در انتهای تقسیم داده ها با استفاده از روش tailing استفاده می کند تا حداقل بازیابی و مدیریت خطا وجود داشته باشد تا سیستم های کلی به هم متصل شوند و nodeهای به هم پیوسته در آن نشان داده شوند.

شکل 2: آدرس توکن توسط حداقل تحمل خطا

مدل ریاضی پیشنهادی

برای پیاده سازی طراحی برای مدل پیشنهادی ما، مراحل زیر برای دستیابی به نتیجه مطلوب مدل انجام می شود.

الف) بارگذاری داده های کاربر و پیش پردازش

در این مرحله، داده های کاربر بارگذاری می شود و داده های خام با چندین پردازش، پیش پردازش می شوند و سپس از داده های تصفیه شده برای بارگذاری استفاده می شود.

ب) پیکربندی مجدد زیرساخت های Cloud

در اینجا یک روش راه اندازی برای پیکربندی مجدد زیرساخت های Cloud وجود دارد.

 

ج) تقسیم بندی داده ها به چندین داده احتمالی تقسیم می شوند و پس از چندین فرآیند، این داده های تقسیم شده با هم ترکیب می شوند و همچنین برای ذخیره سازی در Cloud استفاده می شوند.

 

د) پس از مرحله تقسیم بندی، تخصیص داده ها و ذخیره سازی داده ها انجام می شود. در اینجا داده ها با پیروی از روش های دسترسی از پیش تعیین شده به منابع، به ذخیره سازی Cloud اختصاص می یابد.

 

ه) درخواست داده های Cloud و مدیریت داده ها را می توان بر اساس درخواست مشتری انجام داد. همچنین دسترسی به اطلاعات توسط ارائه دهندگان خدمات Cloud به روز شده و مدیریت می شود. فرآیند مدیریت شامل گرفتن اطلاعات از مصرف کنندگان، پردازش این اطلاعات و همچنین محافظت از اطلاعات ذخیره شده در فضای ذخیره سازی است.

نتایج و بحث ها

بهره وری سیستم پیشنهادی با زمان پخش جریان داده سیستم و طرح عدم ضمیمه محاسبه می شود. نمایش گرافیکی نتیجه بداهه را در مقایسه با الگوریتم های شخص ثالث موجود نشان می دهد. با گرفتن مجموعه داده های مختلط ارزیابی می شود و با مجموعه داده های اصلی Cloud مقایسه می شود تا node معیوب در مدل زیرساخت Cloud پیدا شود.

شکل 3: آنالیز تشخیص node معیوب از سیستم پیشنهادی با الگوریتم های معمولی.

نتیجه گیری

به منظور ایجاد یکپارچه سازی داده ها و مدیریت داده ها در محیط Cloud، در این مقاله ما به این موارد در یکپارچگی داده ها پرداخته ایم و با استفاده از جابجایی داده ها در Cloud و همچنین ذخیره سازی داده ها در مدیریت مکان Cloud با استفاده از اشاره گرهای تحت نظارت و یک سیستم تشخیص خطای بداهه با به حداقل رساندن خرابی ها وجود دارد. در سیستم پیشنهادی ما مجموعه ای از فرآیندهای تقسیم بندی، تفکیک و ذخیره داده را در نظر گرفته ایم. مدل ما با موفقیت میزان دقیق 1.67 را در مقایسه با سایر سیستم های معمولی نشان می دهد و همچنین الگوریتمی بهینه و کارآمد در مقایسه با سایر ارائه دهندگان خدمات شخص ثالث ارائه می دهد.