ابزار MarkLogic
محکزنی پایگاه داده (Database Benchmarking) نقشی حیاتی در زیرساختهای فناوری اطلاعات مدرن ایفا میکند و به سازمانها اجازه میدهد تا از عملکرد، مقیاسپذیری و قابلیت اطمینان سیستمهای خود اطمینان حاصل کنند. در میان ابزارهای متعدد موجود، دو ابزار با اهداف کاملاً متفاوت خودنمایی میکنند. از یک سو، محک MarkLogic ابزاری تخصصی است که منحصراً برای ارزیابی عملکرد در اکوسیستم پایگاه داده MarkLogic توسعه یافته است.
برخلاف ابزارهای عمومی مانند HammerDB، محک MarkLogic یک ابزار بسیار تخصصی است که منحصراً برای سنجش عملکرد پایگاه داده NoSQL خود، یعنی MarkLogic، طراحی شده است. هدف اصلی آن ارزیابی تعامل این پایگاه داده با سختافزار زیرین و همچنین تست نسخههای نرمافزاری آینده است. هدف اصلی محک MarkLogic ارزیابی کارایی پایگاه داده MarkLogic، سنجش پیکربندیهای سختافزاری و آزمودن نسخههای جدید نرمافزار است. خودِ پایگاه داده MarkLogic یک پلتفرم تجاری NoSQL با قابلیتهای ویژهای مانند جستجو، تکرار (Replication) و امنیت است که در صنایع حساس مانند خدمات مالی و برای کاربردهایی نظیر تحلیل هوشمند، مدیریت داراییهای دیجیتالی، مدیریت بحران و دادههای حجیم (Big Data) استفاده میشود. وجود چنین محک تخصصی برای اطمینان از عملکرد بهینه در این محیطهای بحرانی ضروری است.

شکل : نمایی از ابزار MarkLogic
محکMarkLogic برای ارزیابی کارایی پایگاه داده MarkLogic بهدستآمده است و برای ارزیابی تنظیمات سختافزار و نیز نسخههای آینده نرمافزار MarkLogic استفاده میشود. بار کاری MarkLogic به دو مرحله مجزا تقسیم میشود که هر یک جنبه متفاوتی از عملکرد سیستم را میسنجد:
.png)
مرحله دریافت (Ingestion) با حجم بالای عملیات ورودی/خروجی (I/O) شناخته میشود و شامل سه زیرمرحله کلیدی است:
1. در ابتدا، دادهها به حافظه وارد میشوند و تنها عملیات نوشتن روی دیسک، مربوط به ذخیرهسازی ژورنالها (Journal saves) است.
2. پس از پر شدن سریع حافظه، دادهها به دیسک منتقل (Flush) شده و به صورت on-disk stands ذخیره میشوند.
3. با افزایش تعداد این stands، و برای حفظ کارایی پرسوجوها، MarkLogic آنها را با یکدیگر ادغام میکند تا سربار کاهش یابد. این فرآیند شامل خواندن stands قدیمی، نوشتن یک نسخه ادغامشده جدید و حذف نسخههای اولیه است.
برای اطمینان از صحت عملکرد، مراحل فوق چندین بار تکرار میشوند. بهعنوانمثال برای ابزار PCIe Application Accelerators این عملیات 24 بار تکرار شده و هر بازه بین 60-120 دقیقه زمان نیاز دارد و کل زمان آزمون 24-48 ساعت خواهد بود. برای سامانههایی با توان عملیاتی IO پایین، کل زمان آزمون ممکن است چندین روز طول بکشد. آخرین نسخه اصلی منتشرشده از MarkLogic در حال حاضر MarkLogic Server 12 است از جمله قابلیت های آن می توان به موارد زیر اشاره کرد:
- بهبود احراز هویت چندمرحلهای
- تقویت رمزنگاری دادهها
- کنترل دسترسی پیشرفتهتر مبتنی بر نقش (RBAC)
- افزایش قابلیتهای Audit و مانیتورینگ امنیت
- افزایش سرعت اجرای Queryهای پیچیده
- بهبود ایندکسگذاری خودکار
- کاهش زمان پاسخ در دادههای حجیم
- افزایش Performance در پردازش دادههای سندی (JSON/XML)
- بهینهسازی مدیریت دادههای JSON
- پشتیبانی قویتر از Graph Data
- بهبود مدیریت دادههای Semantics و RDF
- یکپارچگی بهتر بین مدلهای داده
- بهینهسازی اجرا در Kubernetes
- توسعه قابلیت Autoscaling
- بهبود مدیریت Cluster در محیط Hybrid Cloud
- افزایش انعطاف در استقرار Microservices
- بهبود ETL داخلی
- اتصال سادهتر به Data Lake
- بهبود پردازش Real-Time Data
- پشتیبانی بهتر از APIهای REST و GraphQL
ارزیابی عملکرد با ابزار MarkLogic
هدف اصلی آزمون MarkLogic محاسبه تأخیر کل است که با استفاده از چهار مشخصه کلیدی ارزیابی میشود. این معیارها، همانطور که در مسیر I/O پایگاه داده شکل 6 نشان داده شده است، گلوگاههای بالقوه در سطح ذخیرهسازی را مشخص میکنند:
- J-lat (تأخیر نوشتن ژورنال): این معیار تأخیر مربوط به ثبت تمام تغییرات پایگاه داده (مانند افزودن، حذف یا جایگزینی) در ژورنال را اندازهگیری میکند. ژورنال برای بازیابی سیستم پس از خرابیهای ناگهانی ضروری است.
- S-lat (تأخیر نوشتن ذخیره): این معیار، تأخیر ناشی از انتقال دادهها از حافظه به دیسک و ایجاد یک on-disk stand را نشان میدهد.
- MW/R-lat (تأخیر خواندن/نوشتن ادغام): برای حفظ کارایی پرسوجوها، MarkLogic دادهها را از چندین stand میخواند، آنها را در یک stand جدید و ادغامشده مینویسد و همزمان عملیات نمایهگذاری و پاکسازی را انجام میدهد. این معیار تأخیر مرتبط با این فرآیند پیچیده خواندن و نوشتن را اندازهگیری میکند.
.png)
شکل: نحوه عملکرد چهار مشخصه ارزیابی MarkLogic
تمرکز عمیق محک MarkLogic بر معیارهای تأخیر I/O، رویکرد آن را از معیارهای مبتنی بر توان عملیاتی HammerDB کاملاً متمایز میکند و زمینه را برای یک مقایسه مستقیم فراهم میآورد.
جدول: مقایسه دو ابزار
|
نام ابزار محک |
پایگاه دادههای تحت پشتیبانی |
معیارهای کلیدی خروجی |
ویژگیهای برجسته |
|
HammerDB |
SQL Server, Oracle, Oracle TimesTen, MySQL, PostgreSQL, EnterpriseDB Postgres, Redis |
TPM ، NOPM، BW، Latency و TPS |
سهولت در راهاندازی و اجرای سریع در مقایسه با TPC اصلی، خروجیهای با ثبات در صورت عدم تغییر پیکربندی، قابلیت اطمینان بالا |
|
MarkLogic |
پایگاه داده NoSQL MarkLogic |
J-lat, S-lat, MW/R-lat |
تمرکز بر رویارویی با چالشهای دادههای حجیم، امنیت و قابلیت جستجوی توأمان، مناسب برای آنالیز هوشمند و مدیریت بحران |
