הגיבוי עובד, אבל השחזור?

שלום לכולם,
בהמשך למאמר קודם שכתבתי על חשיבות הגיבויים ועל ההכרח לבדוק שאכן כל החומר החשוב מגובה, אני הפעם מבקש למקד את תשומת הלב בפן השני של הגיבוי השחזור.
אנו נדרשים לשחזור חומר מגיבוי בתרחישים שונים, אבל המטרה העיקרית של הגיבוי זה להיות מסוגלים לשחזר את השרת במהירות ובאמינות – למצבו קודם לאסון.
את המילה “אסון” מגדיר כל עסק לפי רמת ה”היסטריה” שלו, אבל כמדומני שהתרחיש בו השרת כולו “אובד” (נשרף, נגנב, נפגע מברק וכו’) הוא התרחיש שכולם יגדירו כ”אסון”.

ורבותי, צר לי להיות זה שצריך לבשר לכם – זה אכן אסון….:
תוכנות הגיבוי יודעות לשחזר את השרת למצבו הקודם במהירות ובאמינות רק (!!!!) עם השחזור נעשה לאותו שרת בדיוק !
אני אסביר:

למערכת ההפעלה של מיקרוסופט יש מה שנקרא system state שזה אוסף נתונים של “לב” המערכת שמכיל את המידע על המשתמשים, הרשאות, התוכנות המותקנות וכו’, אבל גם את המידע על חומרת השרת (בקרי דיסק, בקרי רשת וכו’).
מערכות מידע אלו “קשורות” בינם ללא יכולת “התרה”, דהינו : לא ניתן לשחזר את הנתונים של המשתמשים, התוכנות וכו’ ללא שיחזור המידע של החומרה.

במילים פשוטות, זה מה שיקרה בעת אסון כנ”ל:
אתם תמהרו ותרכשו או “תגייסו” שרת אחר, עליו תותקן מערכת ההפעלה עם הדריברים לשרת החדש.
כעת תותקן תוכנת הגיבוי ויתחיל תהליך שחזור, אבל……..: אם תשחזרו את ה system state של השרת ה”ישן”, בתום השחזור השרת החדש לא “יעלה”, שכן שחזרתם גם את הדריברים של השרת הישן ואלו לא מתאימים לחדש.
אם תשחזרו ללא ה system state אין לכם את המידע על המשתמשים, התוכנות, הרשאות וכו’ …..
מלכוד 22 …

אז מה עושים ?

חברות גדולות ועם “כיסים עמוקים” משקיעות בפתרונות יקרים להחריד שכוללים למשל – שרת נוסף (ראי) באתר אחר.
חברות בינוניות רוכשות פתרונות ייעודיים לנושא זה שהגדרתו המקצועית היא: bare metal restore , כמו למשל (ויש עוד פתרונות כנ’ל) תוכנת Symantec livestate recovery with restore anywhere option (עלות הפתרון המבוסס על תוכנה זאת + דיסקים לשמירה + עבודה, כ 2500$ + מע”מ).
עוד אפשרות, זה לקבל החלטה של רכש “כפול”, דהינו רוכשים שני שרתים זהים לחלוטין, אחד מהם מאוחסן (כבוי) באתר אחר – למקרה אסון (עלות: לפי סוג השרת).
חברות יותר קטנות או “רזות”, “מזיקות אצבעות” ומקוות לטוב.
עד כאן “עשיתי לכם שחור”, בפועל המצב קצת יותר טוב, בעבודה מאומצת – לעיתים של ימים – ובעזרת תוכנות צד שלישי, אפשר בסופו של דבר לחזור למצב של שרת בתפקוד מלא, אבל בפרוש לא ניתן חד משמעית להבטיח 100% חזרה לתפקוד מלא לחלוטין וללא בעיות עתידיות ובפרוש יתכן שמדובר בזמן רב של עבודה מאומצת (שמעבר לעלותה לכם אתם מושבתים מעבודה כל עוד היא לא הסתימה…).

אגב, בשרתי לינוקס ונובל החיים הרבה יותר פשוטים, אבל זה לא רלוונטי לרובכם….
ועוד כמה מילים לסיום: ישנם עוד פתרונות “ביניים”, כמו למשל DC נוסף באתר מרוחק, אני לא רוצה להיות “טכני” מדי, אז השורה התחתונה היא זאת שאמרתי מקודם:

כל הפתרונות הללו לא יכולים להבטיח 100% חזרה לתפקוד מלא ואמין.
ולשאלה שבוודאי ימצא מי שישאל: אם צריך את ה Symantec livestate recovery (או דומים לו), אז בשביל מה צריך גם טייפ גיבוי על כך במייל הבא שכותרתו תהיה:
Multi layer backup