داده و اطلاعات
دادهها مجموعهای از حقایق خام و بدون پردازش هستند. اطلاعات، دادههایی هستند که پردازش، سازماندهی و تفسیر شدهاند تا معنایی پیدا کنند.
همانطور که پیشتر نیز اشاره شد، دادهها به خودی خود فاقد مفهوم هستند، اما با تبدیل آنها به اطلاعات، میتوان از آنها برای تصمیمگیری و حل مسائل استفاده کرد. به عنوان مثال، عدد "25" یک داده است، اما وقتی میگوییم "دمای هوا 25 درجه سانتیگراد است"، به یک اطلاعات تبدیل میشود.
ساختار داده
در سیستمهای اطلاعاتی، دادهها برای آنکه قابل ذخیرهسازی، پردازش و بازیابی باشند باید بهصورت سازمانیافته نگهداری شوند. سازماندهی دادهها به شکل ساختارهای منظم باعث میشود اطلاعات بهصورت مؤثر مدیریت شده و دسترسی به آنها برای پردازش و تصمیمگیری آسانتر گردد. یکی از مفاهیم پایه در این زمینه سلسلهمراتب دادهها است که نشان میدهد دادهها چگونه از واحدهای بسیار کوچک شروع شده و به ساختارهای بزرگتر و معنادارتر تبدیل میشوند.
- بیت: بیت کوچکترین واحد داده در رایانه است و تنها دو حالت دارد که معمولاً به صورت صفر یا یک نمایش داده میشود. این واحد نمایانگر وجود یا نبودن یک سیگنال الکترونیکی است و اساس تمام نمایشهای داده در رایانه را تشکیل میدهد.
- بایت: بایت واحدی از داده است که از هشت بیت تشکیل میشود و معمولاً برای نمایش یک نویسه (مانند یک حرف، عدد یا نماد) به کار میرود. ترکیب چند بایت میتواند یک واژه یا رشتهٔ کوتاه را بسازد.
- فیلد: فیلد کوچکترین جزء معنادار داده در یک رکورد است که یک ویژگی مشخص از موجودیت را نشان میدهد؛ مانند نام، نشانی یا شمارهٔ تماس. مقدار هر فیلد را میتوان بهطور جداگانه ذخیره و بازیابی کرد.
- رکورد: رکورد مجموعهای از فیلدهای مرتبط است که اطلاعات کامل مربوط به یک نمونه از موجودیت را در خود نگه میدارد. هر رکورد به کمک دستکم یک فیلد، بهطور مجزا قابل شناسایی است.
- فایل: فایل مجموعهای از رکوردهای همنوع است که در کنار هم نگهداری میشوند و اطلاعات مربوط به یک نوع موجودیت را ذخیره میکنند. هر فایل معمولاً یک موضوع مشخص را پوشش میدهد؛ مانند فایل اطلاعات مشتریان یا فایل سوابق پرسنلی.
- پایگاه داده: پایگاه داده مجموعهای یکپارچه از دادههای مرتبط است که بهصورت منظم سازماندهی میشود تا دسترسی، بهروزرسانی و پردازش اطلاعات به شکل آسان و مؤثر انجام گیرد. پایگاه داده معمولاً از چند فایل مرتبط تشکیل میشود که همگی دربارهٔ یک حوزهٔ مشخص از اطلاعات هستند
پایگاه داده
پایگاه داده مخزنی یکپارچه از دادههای بههموابسته و منطقی است که با ساختاری منظم، امکان دسترسی و پردازش سریع اطلاعات را فراهم میکند. این مخزن بر ذخیرهسازی دادههای پایدار سازمان تمرکز دارد و شامل دادههای موقت (مانند گزارشهای میانی یا اسناد ورودی) نمیشود. ویژگی کلیدی پایگاه داده این است که مدلِ دادهای آن مستقل از برنامههای کاربردی طراحی میشود.
مدیریت اطلاعات
مدیریت اطلاعات فرآیند سیستماتیک جمعآوری، پردازش، ذخیرهسازی، محافظت و ارائه دادهها برای پشتیبانی از تصمیمگیریهای سازمانی است که شامل فعالیتهای زیر است:
- جمعآوری دادهها: شناسایی منابع، استخراج و ثبت اطلاعات در قالب اولیه
- یکپارچگی و اعتبارسنجی: تطبیق دادهها، حذف رکوردهای تکراری و اصلاح نواقص
- ذخیرهسازی: انتخاب پایگاه داده مناسب و ساختاردهی منظم اطلاعات
- نگهداری: بهروزرسانی مداوم، پشتیبانگیری و بازیابی اطلاعات در صورت خسارت
- امنیت: رمزنگاری، کنترل دسترسی و مانیتورینگ تهدیدات
- سازماندهی: طبقهبندی، برچسبگذاری و مستندسازی ساختار داده
- فراخوانی: توسعه API، کوئریهای پیچیده و گزارشگیری خودکار
ویژگیهای پیشرفته پایگاه داده
در طراحی سیستمهای داده پیچیده، شناخت ویژگیهای پیشرفته پایگاه داده اهمیت دارد؛ این ویژگیها امکان بهینهسازی، انعطافپذیری و بهبود عملکرد را فراهم میکنند.
- نمای منطقی: تصویری از نحوه ارتباط و پیوند دادهها با یکدیگر است که فارغ از محل ذخیرهسازی فیزیکی، صرفاً برای درک بهتر کاربر طراحی شده است
- شمای کلی: نقشه و ساختار کلی پایگاه داده است که جایگاه و ارتباط دادهها را پیش از ورود اطلاعات واقعی تعریف میکند
- شمای فرعی: برشی اختصاصی و هدفمند از شمای کلی است که اطلاعات را دقیقاً متناسب با نیاز و زاویه دید یک کاربر خاص نمایش میدهد
سیستم مدیریت پایگاه داده1
DBMS نرمافزاری است که برای تعریف، ایجاد، نگهداری و کنترل دسترسی به دادهها در یک پایگاه داده به کار میرود و عملیات CRUD را برای کاربران فراهم میسازد.
اجزای DBMS
- سیستم واژهنامه داده: DDS2 شامل جداول، نماها، ایندکسها و محدودیتهای ساختاری است
- زبان تعریف داده: DDL3 برای تعریف و تغییر ساختارهای پایگاه داده بهکار میرود
- زبان دستکاری داده: DML4 برای افزودن، حذف و بهروزرسانی دادهها استفاده میشود
- زبان پرس و جوی ساختاریافته: SQL5 برای استخراج و تجزیه و تحلیل دادهها مورد استفاده قرار میگیرد
مدلهای پایگاه داده
مدل سلسلهمراتبی6 ساختاری درختگونه دارد؛ هر رکورد فرزند حداکثر یک والد دارد و میتواند به چندین فرزند متصل شود، بهطوری که روابط «یکبهچند» برقرار میشود. این ساختار برای دادههای طبقهبندیشده مناسب است، ولی انعطافپذیری محدود و تغییر ساختار دشوار است.
مدل شبکهای7 ساختار گرافی با مجموعهنودها و لینکها فراهم میآورد؛ یک رکورد میتواند چندین والد و چندین فرزند داشته باشد، یعنی روابط «چندبهچند» پشتیبانی میشوند. این مدل انعطافپذیرتر است اما طراحی و مدیریت پیچیدگی بیشتری دارد.
مدل رابطهای8 دادهها را در جدولهای دو‑بعدی (رابطه) سازمان میدهد؛ هر جدول شامل سطرهای (رکوردها) و ستونهای (فیلدها) است و بر پایه عملیات ریاضیاتی گزینش، استخراج و پیوند (JOIN) پایهگذاری شده است. این مدل ساده، مقیاسپذیر و گسترده در سیستمهای تجاری است.
مدلهای رابطهای
رابطهگرایی در پایگاه دادهها به مدلی اشاره دارد که دادهها را بهصورت جداول سازماندهی میکند؛ هر جدول شامل ردیفها (سطرها) و ستونها (فیلدها) است. کلیدهای اصلی و خارجی برای برقراری ارتباط بین جداول به کار میروند و عملیاتهای استاندارد SQL امکان جستجو، درج، بهروزرسانی و حذف دادهها را فراهم میسازند.
انواع رابطه
- یک به یک: رابطهای است که هر رکورد در یک موجودیت تنها با یک رکورد در موجودیت دیگر مرتبط میشود و برعکس.
- یک به چند: رابطهای است که یک رکورد در یک موجودیت میتواند با چند رکورد در موجودیت دیگر ارتباط داشته باشد، اما هر رکورد در سمت مقابل فقط با یک رکورد مرتبط است.
- چند به چند: رابطهای است که چند رکورد از یک موجودیت میتوانند با چند رکورد از موجودیت دیگر در ارتباط باشند و معمولاً با یک موجودیت میانی پیادهسازی میشود.
مدلهای ستونی
مدل داده ستونی یک روش سازماندهی داده است که در آن دادهها به جای ذخیره شدن به صورت ردیفی، به صورت ستونی ذخیره میشوند. به عبارت دیگر، همه مقادیر یک ستون خاص در کنار هم قرار میگیرند. این روش با مدل ردیفی که در آن دادهها به صورت ردیف در کنار هم ذخیره میشوند، تفاوت دارد.
در مدل ردیفی، برای دسترسی به تمام دادههای یک رکورد خاص، باید تمام ردیف مربوطه را بخوانیم. در مقابل، در مدل ستونی، میتوانیم فقط دادههای مربوط به ستونهای مورد نیاز را بخوانیم. این ویژگی باعث میشود که مدل ستونی برای تحلیل دادهها مناسبتر باشد، زیرا امکان فشردهسازی بهتر و دسترسی سریعتر به دادهها را فراهم میکند.
مدل پایگاه داده شیگرا
مدل پایگاه داده شیگرا یکی از فناوریهای مهم نسل جدید برنامههای چندرسانهای مبتنی بر وب است. یک شی شامل مقادیر دادهای است که ویژگیهای یک موجودیت را توصیف میکند و عملیاتی که میتوان روی آن دادهها انجام داد. این قابلیت کپسولهسازی به مدل شیگرا اجازه میدهد تا دادههای پیچیدهتر (گرافیک، تصویر، صدا، متن) را بهتر از سایر ساختارهای پایگاه داده مدیریت کند.
نمودار رابطه موجودیت9
نمودار رابطه موجودیت نمایش گرافیکی موجودیتها، ویژگیهای آنها و ارتباطات میان آنهاست. این نمودار در مرحلهٔ تحلیل سیستم برای شناسایی نیازهای دادهای، طراحی ساختار منطقی بانک اطلاعاتی و مستندسازی روابط بین جداول استفاده میشود. با استفاده از نمادهای استاندارد (مستطیل برای موجودیت، بیضی برای ویژگی، خط برای ارتباط) میتوان پیچیدگیهای مدل دادهای را بهصورت بصری درک کرد و بهسرعت تغییرات ساختاری را ارزیابی کرد.
مراحل ترسیم نمودار ERD
- شناسایی موجودیتها: تشخیص عناصر اصلی سامانه که دادهها دربارهٔ آنها گردآوری و نگهداری میشود.
- شناسایی روابط: تعیین نحوهٔ ارتباط موجودیتها با یکدیگر از نظر وابستگی و نوع تعامل دادهها.
- تهیه یک پیشنویس از نمودار ERD: ترسیم یک نسخهٔ ابتدایی از نمودار برای نمایش موجودیتها، ویژگیها و ارتباطات اصلی.
- نگاشت عناصر داده به موجودیتها: تخصیص هر ویژگی یا دادهٔ موردنیاز به موجودیت مناسب در نمودار
- انجام تحلیل داده: بررسی سازگاری، حذف ابهامها و اصلاح وابستگیها برای حصول ساختار دقیق و منطقی.
- تهیه یک نمودار ERD اصلاح شده: بازطراحی نمودار بر اساس نتایج تحلیل و ایجاد یک طرح منسجم و کاملتر.
- بررسی نمودار ERD با کاربران و بازبینی: ارزیابی نمودار توسط کاربران نهایی و اعمال تغییرات لازم برای هماهنگی با نیازهای واقعی.