עלות הבעלות והאחסון של המידע

תרגום מאמרו של גיין נייגל

ניהול האחסון מהווה היום סוגיית מפתח בסביבת המידע של ימינו. כבר לא נדיר לראות אתרים עם מאות טרה-בייטים או אפילו פטה בייטים שמכריחים את המנהלים להביט מעבר לשיטות האחסון והאבטחה המסורתיות למידע הארגונית החיונית.


ראשי פרקים

 הקדמה

 מזעור עלות העדכון

מחיר ה-Downtime

כימות החיסכון בעלויות אוטומציה

סיכום


 

הקדמה

 סטטיסטיקות מוכיחות כי על כל דולר מושקע בחומרה לאחסון מידע, ארגונים מוציאים שלושה דולר לניהול המידע האגור בחומרה זו.
לא פלא כי עלות הבעלות על המידע טיפס לעין שיעור בשמונה שנים האחרונות.
יותר ויותר מנהלי מערכות פנו לטכנולוגיות ניהול אוטומטי לפתרון בעיותיו בניהול המידע. ההתקדמות בחומרה ובתוכנה לאחסון הביאו להופעת פתרונות כגון פונקציות אוטומטיות  של ניהול האחסון ההיררכי (
HSM ), תיוק, וטיפוח הדיסק, אשר מטרתם להיטיב את ההשקעה בחומרת אחסון ובו זמנית להגן על המידע הארגוני היקר.
מרכיב מפתח בכל ארכיטקטורה של אחסון אוטומטי הוא ספריית טייפים. ספריות אלו מצוידות בכונני טייפ המסוגלים לאחסן עשרות גיגה בייטים של מידע בקלטת אחת. התקדמות בטכנולוגיה של הכונן, רובוטיקה, ותוכנה, שיפרו כל כך את הגישה למכשירים אלו שספריות טייפ כל פעם נכנסות יותר לשימוש במקום היישומים המסורתיים לגיבוי וארכיבאות.

רוב המערכים לאוטומציית האחסון נשענות על הזזת הקבצים אשר בשימוש מופחת לאחסון שניוני ושלישוני – לרוב בספריית טייפ אוטומטית- בהם עלות האחסון קטנה יותר מאשר בכונני דיסקים קשיחים.

 אין כמעט ויכוח בדבר תועלת העלות באוטומציה של מתקני אחסון. אבל יש ויכוחים רבים סביב המקום שתופסות ספריות הטייפ בתמונה הכוללת, החל מאיזו טכנולוגיית טייפ ועד איזה תצורה ספריה לבחור. כאשר זה מגיע לעלות הבעלות הכוללת -   TCO,Total Cost of Ownership, המצטיינות הן יתרונות העלות של התצורות המודרניות לספריות הניתנות להגדלה.

 החזר ההשקעה באוטומציית האחסון יכול להגיע במהירות, אם נלקחות בחשבון ההוצאות ההולכות וגדלות הקשורות בניהול המידע. בשוק ה- PC LAN נמצא כי מנהלי מערכות משקיעים בממוצע 954 שעות לאתר לשנה בניהול הגיבויים. ניהול הגיבויים הוגדר כטיפול במדיה וטיפול בתקלות, והוכח כי ניהול זה מהווה התהליך שגוזל הכי הרבה זמן בכל תהליך הגיבוי.
תפקידה של אוטומציית אחסון המידע נעשה יותר ויותר חשוב תוך כדי מעבר החברות להקטנת עלויות ניהול מידע זה ויישום טכנולוגיות חסכונית מוכחות.

למרות שהאוטומציה מהווה מפתח לבקרת עלויות מדהימות של ניהול מידע, מנהלי מערכות נאבקים עם סדרה של נושאים חדשים כאשר עליהם להחליט על הגישה הטובה ביותר לאוטומציה של סביבות האחסון שלהם.

עליהם להגדיר את התערובת המיטבית של טכנולוגיות אחסון על ידי שימוש בדיסק on-line ובטייפ near-line, (ויתכן גם בתקליטור אופטי) בכדי להגיע למרב ההגנה והאבטחה על המידע תוך כדי צמצום עלויות. ספריות טייפ אוטומטיות הפכו לכלי חיוני כחלק מפתרון אוטומציה זה. שוב, מול מבוך מדהים של אפשרויות, על המנהלים להיות מודעים למספר גורמים בקבלת ההחלטה לרכוש ספריית טייפ. גורמים אלו כוללים נפח, ביצוע, וטכנולוגיית הטייפ המתאימה -4mm., 8mm., 3490, Magstar, או DLT. אחד הגורמים  המכריעים  ברכישה -ולעיתים קרובות נעלם מן העין- הוא מחיר הבעלות הכולל, או TOC- Total Cost of Ownership

 לכמת את עלות הבעלות יכול להיות תהליך בלתי מדויק, אך בכל ניתוח יש מספר מרכיבי מפתח שיש לקחת בחשבון בזמן חישוב משוואת העלות. לספריות טייפ גורמים אלה כוללים את המחיר ההתחלתי של חומרת הספרייה, עלויות המדיה, אחריות ,תחזוקה, תיקונים, מחיר השדרוג, מחיר ה- downtime ומחיר החיסכון  שנוצר על ידי פעולות ניהול אוטומטי של האחסון.

 רוב מרכיבים אלו הם פשוטים וקלים להבנה, אך שלושת האחרונים –חסכון עלויות אוטומציה , מחיר ה-downtime, ומחיר השדרוג-הם אולי הקריטיים והנשכחים  ביותר במשוואת עלות הבעלות.


מזעור עלות העדכון

הדרישות המחמירות של ספריות עדכניות, והן הדרישות של לקוחות לפתרון בעיית עלות השדרוג נתנו השראה למספר חברות ליצירת ארכיטקטורה חדשה של ספריות טייפ ממוקדת בתצורה הניתנת להרחבה ובעלת זמינות גבוהה. התוצאה היא שניתן כעת להשיג ספריות DLT הניתנות להרחבה בקלות. יצרנים מספר מציעים להיפרד לתמיד מתצורת הספריות המסורתיים של "גוש אחד", אשר מגבילות את המשתמש למספר מרבי של כוננים וקלטות בתוך אריזה אחת. ספריות מונוליתיות אלה גם חשופות עם מספר נקודות כשל יחידות (נקודת תורפה בודדת שיכולה לגרום בתפקודה הלקוי לקריסת כל המערכת) יכולות לגרום למום במערכת ולהעלים את אפשרות הגישה של המשתמש למידע קריטית.

התקן של ספריותDLT   מודולאריות וניתנות להרחבה היה זמין מאז תחילת 1996. משתמשים יכולים להתחיל יישום ספריה עם "מודול בסיס", עם אחד או שני כונני DLT ומגזין אחסון כולל בעל 10 קלטות ניידות. מודולי בסיס הללו בעלי התפקוד מספקים היום את צרכי הגיבוי של הרשתות העכשוויות עם אחוזי העברה מקוריים ומוחזקים של מעל 36 GB לשעה וקיבולות מקור של מעל 350 GB. אז, כאשר במקום כלשהו דרישות האחסון גדלות, העצוב המודולארי מאפשר הרחבה מודולארית ויחס עלות תועלת משופר (cost-effective)

למה להכריח מנהל מערכת מידע להגדיל השקעה קיימת בחומרת ספריה ולהשיג יכולות לא נחוצות רק כדי לעדכן את הספרייה? במקום לרכוש ספריה שלמה חדשה כפי שנדרש על ידי התצורות המונוליתיות, הרחבת הספריות העכשוויות הניתנות להרחבה רבה מעבר למודול בסיס פשוט רק צריך מודולים נוספים, ומספקת הרחבה נטולת תפרים.

טכנולוגיות ייחודיות של מעבר-דרך מזיזות את הטייפים במהירות גבוהה ממודול למודול ומאפשרות לכל קלטת טייפ לעבור מכל כונן נגיש במערכת לכל מקום אחסון. כל מודול בסיס יכול לתפקד לבדו גם, עם הסרה קלה מן המערכת כאשר צריכים ספריה של 150 עד 350 GB לעבודות גיבוי מחלקתיות חשובות.

האפשרות להרחיב באופן מודולארי את הקיבולת ואת התפקוד בקפיצות הגיוניות הינו המאפיין ה cost-effective ביותר של האחסון המודולארי. מרכיבים עודפים יכולים לעזור לספק דרישות של נגישות גבוהה של סביבות רשת מחשבים עכשוויות. 

ארכיטקטורה מונוליתית של ספריות מגבילה את האפשרויות להרחבה למספר קבוע של כוננים וקלטות. מספר מוצרים כאלה מאפשרים ללקוחות להתחיל עם קונפיגורציה מזערית של כונן אחד או שניים ולאחר מכן מוסיפים עוד כוננים, אך תמיד בגבולות אריזת ספריה בודדת. בכדי להרחיב את יכולות הספרייה מעבר לגבולות אלה, על הלקוחות לרכוש ספריה שלמה נוספת, גם אם צרכי האחסון הנוכחיים שלהם צריכים הגדלה צנועה בלבד מעבר ליכולות הספרייה הנוכחית הבודדת.

התצורה הניתנת להרחבה של מערכות מודולאריות אינה מציבה כאלה מגבלות למשתמשים. לקוחות יכולים להתחיל בקטן עם מודול בסיס יחיד עם כוננים דואליים ואז להרחיב את המערכת עם תוספות מודולאריות מותאמות אישית, עד לקיבולות שיתאימו לדרישות אחסון משתנות. הגמישות של דגם הניתן להרחבה מועיל בשני מישורי מפתח: המשתמשים יכולים להרחיב לספריה כדי לרכוש רק את הקיבולות הנדרשות, ויכולים לחשב בקלות את חסכונותיהם בעלויות מול מספר רב של מתקנים אוטומטיים בלתי רציפים.

אפשרויות הרחבה המוצעות על ידי מספר יצרנים של ארכיטקטורת אחסון הניתנת להרחבה מאפשרות למשתמשים להרחיב את המערכת המבוססת על דרישות אישיות  עם מודולים של קיבולת-המכילים רק קלטות DLT להמרצת הקיבולת הכוללת של הספרייה – או עם מודולים שמכילים כונני DLT נוספים – לשיפור סך כל התפוקה של הספרייה ולאפשר ליותר משתמשים לאחזר מידע ביעילות.

חסכון העלויות בגישה זאת יכולה להיות משמעותית. במידה במערכת ספריה מונוליתית נמצאת מאוכלסת במלואה על ידי כוננים וארונות של קלטות, האפשרות הזמינה היחידה להרחבה היא לרכוש ארון נוסף של ספרייה נפרדת עם רובוטיקה, כוננים, אלקטרוניקה של בקרה ומקומות אחסון לקלטות נוספים. לא בדיוק רכישה cost-effective כאשר הצורך היחיד הוא הספק נוסף. ללקוח אין ברירה, תצורות אלו של "הכול או כלום" מספקים רק אפשרות אחת ומאוד יקרה של הרחבה.


מחיר ה-Downtime

עוד מאמר ארוך שלם היה נדרש כדי לכסות את כל הנושאים הקשורים בחישוב מחיר ה-Downtime. למרות זאת, ניתן לומר בבטחה כי בסביבת היישומים החדשים לספריות טייפ המטרה היחידה המתקבלת היא downtime = אפס. תצורה מודולארית ו-fault tolerant המספק רמת הגנה כנגד תקלה ו-downtime אשר פשוט אינה אפשרית עם תצורות מונוליתיות.

חישובי עלות הdowntime- לארגון משתרעים על פני תווך רחב, מ-1000$ ל-10000 $ לשעה – אפילו 100,000 $ לדקה במקרה של פעולות בזמן אמת. דו"ח של Gartner Group מציב את השאלה "איך אתה מגיע למספר שהנך בטוח הוא מדויק?". הינה תשובה קצרה : " אתה לא. העלות האמיתית של downtime אינה ניתנת להגדרה"

בהיבט רחב, העלות של ה-downtime בשרת קשור לסביבת היישומים, וגורם לעלויות גבוהות בהרבה לפעולות של סביבות היצור והעיבוד, אך עדיין יקרות לכל ארגון. Gardner Group גם מצביע על כי חישובי עלות ה-downtime  מתייחסות רק לאיבוד יצרנות לארגון, הם מתעלמים מאיבוד עיבוד, איבוד עסקות וחוסר שביעות רצון של הלקוחות.

עם היישומים החדשים לספריות טייפים הדורשים גישה רציפה למידע האגור על גבי הטייפ, אותן דרישות של אפס downtime שנדרשו באופן מסורתי משרתי רשת מיושמות לספריות טייפ האוטומטיות.

התצורה האמינה מאוד של ספריות הניתנות להרחבה ושל תפקוד גבוה מביא רמה חדשה של אמינות ו-fault tolerance לתצורות ספריות עם המטרה למזער את הdowntime היקר. לכמת את האמינות של תצורות ספריות הטייפים הוא נושא שלא הוצג כראוי בקבוצות מספר. ליתר דיוק, משווקים של תצורות ספריות מונוליתיות השתמשו בניתוח המסורתי של אמינות בלתי תלויה בניסיון לפקפק באמינותו של התצורה המודולארית. מתנגדים אלו התייחסו באופן טיפוסי לדגמי אמינות מיושנים אשר לוקים בבעיה של קבילות כאשר מיושמים בטכנולוגיה של ספריות טייפ.

על פי Strategic Research, "ספריה מעוצבת היטב עם מספר רב של כוננים תשיג אחוז נמוך יותר של תקלות מאשר כוננים בלתי תלויים, מפני שהספרייה מציגה סביבה עקבית ומבוקרת לכוננים. אי לכך, אחוז התקלה הממוצע העולמי האמיתי למערכת ספריית טייפ הינה נמוכה מאשר בשילוב של כוננים בודדים".

הערכה זו של זירוז הטכנולוגיה של ספריות כנגד החוכמה הקונבנציונאלית של תצורה המכריזה שכמה שיותר חלקים מוספים למערכת יש יותר סיכוי לתקלה, עם כל שאר הגורמים קבועים. למרות זאת, כל הדברים אינם זהים ו-כפי שצוין על ידי Strategic Research, דגם זה של אמינות אינו מתאים לטכנולוגיית טייפ.

התקנה של מודולים רבים הינה מבודדת במידה רבה כנגד תקלה הרסנית על ידי מרכיביה העודפים. תצורות מונוליתיות אינם מציעים ביטחון דומה כנגד תקלות מרכיבים. נקודות כשל יחידות- כמו למשל אלקטרוניקה או רובוטיקה – משאירות ספריות מונוליתיות במצב פגיע בהרבה לתקלה קטלנית שתשאיר את המערכת בלתי ניתנת להפעלה ותפסיק את הגישה של המשתמש למידע.


כימות החיסכון בעלויות אוטומציה

כפי שהוכח על ידי ממצאי Strategic Research, גיבוי המידע הינו חלק הארי בעוגת ניהול המידע, ומהווה סוגיה בה אוטומציה של התהליך עם ספריית טייפ יכולה לשלם דיבידנדים מידיים. באופן כללי, היתרונות של טכנולוגיה של ספריית טייפ  אוטומטיות  כוללים:

®גיבוי בלתי מלווה של כל השרתים ומידע קריטית בתחנות העבודה לרוחב מספר רב של טייפים. התערבות ידנית נדרשת באופן טיפוסי רק פעם בשבוע.

® ניהול אוטומטי של המדיה מבטיח רוטציה תקינה של הטייפ ומספר רב של דורות גיבוי, ומונע אסון אפשרי במידה וטייפ אחד פגום.

®המשתמש יכול לאחזר את המידע שלו אם הוא מורשה, ללא התערבות מנהל רשת.

®עם השימוש בטייפ לעלות נמוכה, האחסון ה-Online הסמוך דורש עבודה אינטנסיבית אלה אם הוא מתבצע על ידי ספריית טייפ רובוטית ומערכת אוטומטית של ניהול אחסון הירארכית - automated Hierarchical Storage Management system

יתרונות ספריית טייפ אוטומטית גדולים אפילו יותר בקונפיגורציה של קונן דואלי. ישנם ארבע נקודות מפתח ההופכות את רב הכונן כמעט להכרחי לסביבות אחסון הרשת של ימינו :
®ביישומי גיבוי רבים עם חלונות גיבוי הולכות ומצטמצמים, השלמת הגיבוי בזמן שנקבע מראש ללא כונן דואלי הנה בלתי אפשרית. כונן דואלי מסוגל לקצר כמעט לחצי את משך הגיבוי
®העובדה שיש שני כוננים מאפשר לצור בקלות עותקים מחוץ לאתר (off site) הן על ידי mirroring בעת הגיבוי או הן על ידי יצירת העתקים off-line לאחר השלמת הגיבוי.
®כאשר מגבים מידע קריטי, שני כוננים מבטלים נקודת כשל חשובה.
®עם שני כוננים או יותר בספריה רובוטית, ניהול האחסון ההירארכי רץ יותר בקלות, עם פחות סיכויים של משתמש החייב לחכות בתור להורדה בחשיבות של קובץ כלשהו.


סיכום

ספריות טייפ אוטומטיות הם מרכיב הכרחי בלוחמה נגד עלויות ניהול האחסון. על קניינים של טכנולוגיות ספריה לקחת בחשבון מגוון גורמים מעבר למחיר בכדי לקחת החלטת רכישה נבונה. הדרך האמינה היחידה להבטיח את המוצר הטוב ביותר היא  לעמוד את עלות הבעלות הכוללת, ולקחת בחשבון גורמים כגון חיסכון הזמן ועלויות הניהול הקשורות לאוטומציה של תהליכי הגיבוי והאחזור של המידע, התוצאות האפשריות של downtime הספרייה, ועלות השדרוג, במידה והספרייה ניתנת לשדרוג.
 

תוצאות ניתוח זה מדברות בשבח ההגדלה המודולארית. אין ספריות טייפ אחרות המציעות את החיסכון בעלויות הקשורות לשדרוג הספרייה על ידי צרוף היכולות שיש בהן צורך בלבד בסביבות לקוחות ייחודיים. לדוגמא, המשתמש אינו חייב לרכוש כוננים או רובוטים נוספים- שהיא הנורמה בתצורות ספרייה מונוליתיות – כאשר צריכים רק עוד קיבולת. הארכיטקטורה של תצורה מודולארית החדישה גם מציעה הגנה שלא נראה כמוה עד כה כנגד תקלה קטסטרופאלית שמשפיע על נגישות לספרייה כחלק מסביבת רשת האחסון הכוללת.

בניסוח פשוט, ניתן להגדלה הינו טוב יותר – Scalable is better

http://www.storagesearch.com/costdata.html


הערה: ברור כי המחבר איננו מכיר את מערכת BOS, המיישמת הלכה למעשה את מסקונות מאמר זה.