اوپنایآی ارائهدهنده ابری را عامل قطعی ChatGPT دانست و نبود سیستم خودکار انتقال اضطراری را دلیل طولانیشدن اختلال عنوان کرد.
اوپنایآی گزارشی از حادثه منتشر کرد که علت قطعی هفته گذشته ChatGPT و اقدامات پیشگیرانه برای جلوگیری از تکرار آن را شرح میدهد. این اختلال از ۲۶ دسامبر ۲۰۲۴ ساعت ۱۰:۴۰ صبح آغاز شد و تا ساعت ۳:۱۱ بعدازظهر بهجز ChatGPT که تا ۶:۲۰ عصر بهطور کامل بازیابی شد، تا حد زیادی برطرف گردید.
خدمات تحت تأثیر:
- ChatGPT
- ساخت ویدیو با Sora
- APIها: عوامل، گفتار بلادرنگ، دستهای و DALL-E
علت قطعی OpenAI
دلیل این قطعی، خرابی مرکز داده ارائهدهنده ابری بود که بر پایگاههای داده اوپنایآی تأثیر گذاشت. با اینکه پایگاههای داده در چند منطقه منعکس شدهاند، انتقال به یک نسخه پشتیبان نیازمند مداخله دستی ارائهدهنده ابری بود تا عملیات به مرکز داده دیگری هدایت شود. این مداخله دستی علت رفع مشکل اعلام شد، اما دلیل طولانیشدن آن به مقیاس این پروژه نسبت داده شد.
Failover فرآیندی خودکار برای تغییر به سیستم پشتیبان در صورت خرابی است. اوپنایآی اعلام کرد که در حال انجام تغییرات زیرساختی برای بهبود واکنشها در برابر خرابیهای آینده پایگاه دادههای ابری است.
اوپنایآی توضیح داد:
«در هفتههای آینده، ما یک ابتکار بزرگ زیرساختی را آغاز خواهیم کرد تا اطمینان حاصل کنیم که سیستمهای ما به خرابیهای طولانیمدت در هر منطقه از ارائهدهندگان ابری مقاوم هستند. این اقدام شامل اضافهکردن لایهای از واسطه تحت کنترل ما بین برنامهها و پایگاههای داده ابری خواهد بود که امکان Failover بسیار سریعتر را فراهم میکند.»
قطعی قابلتوجه ChatGPT
اوپنایآی اعلام کرد که این اختلال به دلیل خرابی منطقهای پایگاه داده ارائهدهنده ابری رخ داد، اما تأثیر آن جهانی بود؛ شواهد این امر گزارشهای کاربران در شبکههای اجتماعی از سراسر اروپا و آمریکای شمالی است.
Shortlink for this post: https://blog.talahost.com/?p=1322