Представники компанії Skype вчора опублікували дані, що пояснюють природу найпотужнішого збою у популярній системі інтернет-телефонії, а окрім того подали відомості, завдання яких полягає в тому, щоб переконати користувачів у неповторенні подібного надалі.Представники компанії Skype вчора опублікували дані, що пояснюють природу найпотужнішого збою у популярній системі інтернет-телефонії, а окрім того подали відомості, завдання яких полягає в тому, щоб переконати користувачів у неповторенні подібного надалі.Нагадаємо, що минулого вівторка і середи система Skype вийшла з ладу по всьому світу, в результаті чого відбулося каскадне відключення командних серверів Skype, а також "супервузлів", що відповідають за комутацію трафіку. Відразу після збою компанія повідомила, що інженери Skype працюють над усуненням проблеми, але тим не менше, повне відновлення зайняло майже добу.
Напередодні інформаційний директор Skype Ларс Раббі заявив, що мережа повністю відновилася і готова обслуговувати своїх користувачів в повному обсязі. Він також зазначив, що останній збій у Skype став можливий через специфічну архітектуру системи інтернет-телефонії. У блозі компанії він говорить, що Skype стала заручницею своєї ж власної мережної архітектури.
Сильна сторона архітектури Skype полягає в тому, що вона дозволяє системі передавати дуже великі об'єми трафіку у реальному часі, уникаючи критичних навантажень, але з іншого боку, коли відбувається який-небудь збій у системі, що виводить з ладу один або декілька центрів комутації, то інші "сипляться" слідом за ними. Технічно, пише Раббі, Skype може витримати великі навантаження і відмову будь-якого вузла, але тільки не кореневих центрів комутації - "супервузлів". Саме останнє і сталося зі Skype на минулого тижня.
За словами представника компанії, навантаження в мережі Skype розподіляється за піринговим принципом, тобто два або більше комутуючих вузла можуть передавати один одному дані у разі завантаження. Технічно, система будується на базі технології Global Index, яка також прив'язана до P2P-технології. Ця технологія дозволяє управляти різними функціями "супервузлів" і підрядних серверів.
Минулого тижня через великий потік коротких повідомлень деякі сервери, відповідальні за даний функціонал, виявилися перевантажені, що спровокувало черги у доставці повідомлень. Деякі користувачі Skype працювали з Windows-клієнтом системи 5.0.0152, який мав помилку, не дозволяла працювати з відкладеними повідомленнями. Таким чином, приблизно половина користувачів Skype користувалася збірною версією, причому 40% користувачів явно зіткнулися з даною проблемою. Таким чином, 25-30% суперузлів виявилися завантажені чергами, які не могли розпізнати клієнти.
Раббі говорить, що багато користувачів, зіткнувшись з одночасним збоєм у системі, почали перезавантажувати "залогінених" клієнтів, спровокувавши на сервери ще більше навантаження. Таким чином, у системі вийшов свого роду інформаційний колапс.
Зараз у Skype були встановлений суперузли оновленої конфігурації, що володіють більшою ємністю, а окрім того, нова версія створена за принципом "хмарного P2P", що теоретично має додати відмовостійкості всій системі.