בשנים האחרונות, חברות SaaS מגלות מחדש את עולם ה-NOC. למעשה, חברות כאלה הופכות תלויות יותר ויותר ב-NOC איכותי לצורך התייעלות וצמיחה, וזה לא מפתיע, לנוכח אופי פעילותן.
שלא כמו בחברות הזנק “קלאסיות” המתמקדות בפיתוח, בחברות SaaS האופרציה השוטפת והשירות למשתמשים ממלאים תפקיד מכריע. כמו כן, תקלות בלתי צפויות ואתגרים טכנולוגיים חדשים צצים ללא הרף בעולם אפליקציות הענן. ואולם, בעוד שמספר התקלות הפוטנציאליות רק הולך ועולה, היקף משאביהם של ארגונים רק הולך ומצטמצם בשוק התחרותי במיוחד של ימינו.
כאן ה-NOC נכנס לתמונה. יותר ויותר חברות SaaS מתחילות להבין שהן אינן יכולות להסתפק במערך NOC אוטומטי בסיסי או להסתמך רק על אנשי הפיתוח או ה-DevOps ושאין די בהשקעה ראשונית בתשתית NOC, אלא נדרשים לארגון שירותי NOC מתקדמים. יותר מכך, הישענות על מערך NOC חכם, המאפשר ניטור שוטף, מקיף וצופה פני עתיד, צריכה להיות אסטרטגיית ליבה עסקית של חברות SaaS כיום, על מנת שיוכלו לעמוד ביעדים שהציבו לעצמן.
השקעה ב-NOC כאסטרטגיה עסקית מכרעת
כיום, עדיין יש אחיזה לתפיסה הרואה בשירותי NOC אנושיים תופעה מיושנת. רבים עדיין סבורים עדיין כי אוטומציית NOC מהווה תחליף הולם לאנשי NOC העומדים לשירות הארגון באופן שוטף, אך זו כשלעצמה תפיסה מיושנת.
אימוץ גישה אסטרטגית ל-NOC, כמתחייב מטיב פעילותן של חברות SaaS ומתנאי השוק, מצריך כצעד ראשון, השקעה משמעותית במשאב האנושי. הגדרת תפקידם של מהנדסי ה-NOC המשרתים את הארגון כאסטרטגי וכצופה פני עתיד יאפשר לאתר בעיות פוטנציאליות מבעוד מועד, באופן יעיל בהרבה. כך ה- NOC יהפוך לכלי פרואקטיבי חשוב, המבטיח שיפור משמעותי באופרציה.
מהנדסי NOC הם גם אנשי הצוות האידאליים לתפעול מערך ה-NOC 24/7, לאור היכרותם המעמיקה עם בעיות אופרציה פוטנציאליות ויכולתם לאבחן בעיות כאלה בשלב מקדמי. יתר על כן, מומחיותם והיכרותם עם המערכת מאפשרות למהנדסי ה-NOC להגיב במהירות לבעיות שצצות ברמה היישומית ולפתור אותן. הדבר מפחית את העומס המוטל על מחלקות המו”פ וה-IT ומאפשר להן להתמקד בפעילות פיתוח ברמה האסטרטגית.
בד בבד, לצד שימוש בשירותיהם של מהנדסי ה-NOC, יש לשכלל את תהליכי הניטור עצמם ואת הידע שבבסיסם. כפי שיפורט להלן, מערך NOC מוצלח, המותאם לצורכיהן העדכניים של חברות SaaS, כולל שלושה מרכיבים מרכזיים: שימוש בלוח בקרה מרכזי וניהול ממורכז של Runbook/Playbook שמתעדכן באופן שוטף; תפעול NOC חכם 24/7/365; והישענות על מערך ניטור אנושי בזמן אמת.
רק שילוב בין שלושת המרכיבים הללו יאפשר ניצול מיטבי של הכלים, הכישורים והתהליכים העומדים לרשות הארגון בתחום הניטור, ויבטיח אופרציה יעילה לאורך זמן.
Runbook/Playbook מתעדכן שמחובר ללוח בקרה מרכזי
מערך NOC מוצלח מתבסס על חיבור בין לוח בקרה מרכזי שדרכו מתבצעת כל פעילות הניטור, לבין Runbook/Playbook ממורכז, שמתעדכן באופן שוטף ומכיל את כל הידע שהצטבר בארגון בתחום הניטור עד אותה נקודת זמן.
באופן זה ניתן לקבל בכל רגע נתון תמונת מצב כוללת ומדויקת באשר לאיכות האופרציה של שירותי החברה ולטפל בצורה יעילה יותר בתקלות קיימות ועתידיות. במילים אחרות, אינטגרציה בין ה- Runbooks השונים הקיימים בארגון וחיבורם ללוח בקרה מרכזי מאפשר זרימה יעילה רציפה של ידע חיוני בתוך הארגון. מי שנהנים מכך הם אנשי ה-NOC בארגון ומשתמשי הקצה כאחד.
תוכנת ה-XiteIT שפיתחנו ב-MoovingON היא מוצר ייחודי שיוצר את החיבור הנדרש בין ה-Runbook הארגוני לבין לוח בקרה מרכזי שאליו מוזרמות כל ההתרעות על תקלות קיימות ופוטנציאליות במערכת. איך זה עובד?
ראשית, לוח הבקרה המרכזי שלנו מקנה לכל אדם מורשה בארגון בכל רגע נתון גישה לסטטוס ביצועי המערכת הכוללים, אשר מוגדרים לפי מדדים ופרמטרים ברורים המותאמים אישית לכל בעל תפקיד. כך ניתן לזהות ביתר קלות את מקורן של תקלות שנוטרו ולפתור אותן באופן יעיל יותר.
שנית, לוח הבקרה המרכזי מחובר ל- Runbook ארגוני פעיל, שמגיב בזמן אמת להתרעות הזורמות ללוח הבקרה המרכזי באמצעות שורה פשוטה, מדויקת וברורה של משימות לביצוע המיועדות לטפל בבעיה המדווחת, בלי קשר לרמת המורכבות של הבעיה. לצד זה, ה- Runbook מתעדכן כל העת, בהתאם לפתרונות חדשים שהותאמו לתקלות שאותרו במערכת.
עדכון ה- Runbook באופן שוטף מאפשר תיעוד ושיתוף של ידע ארגוני חיוני שנצבר בידי אינדיבידואלים בארגון. באופן זה, פוחתת התלות של הארגון בבעלי תפקידים ספציפיים ומתאפשרת העברה יעילה של ידע בתוך הארגון.
הייחודיות של XiteIT נעוצה, בין השאר, במנעד האוטומציה שהיא מציעה. רמת האוטומציה ניתנת להגדרה לפי צורכי הארגון ואופי המערכת: החל מהפעלה אוטומטית של Runbook מתאים, דרך עבודה היברידית, המשלבת בין הפעלה אוטומטית ומעורבות של גורם אנושי, וכלה בשימוש ב-Runbook, המחייב תפעול ע”י גורם אנושי.
NOC חכם 24/7
ביסודו של דבר, על מנת להבטיח פעילות רציפה וחלקה של המערכת, יש לנטר אותה באופן שוטף, 24/7, באמצעות מערך NOC חכם. מערך כזה מנטר לא רק את פעילות הרשת והתשתית, אלא גם את תקינות האופרציה של האפליקציה והשירותים עצמם, ומזהה כל שינוי רלוונטי שעשוי להעיד על תקלה קיימת או פוטנציאלית. כמו כן, NOC חכם יתבצע דרך לוחות בקרה המותאמים באופן ספציפי לצורכי הארגון, ויאפשר לסנן החוצה התרעות כוזבות או לא רלוונטיות.
ניטור איכותי של מערכות SaaS המבקשות לספק שירותים רציפים, יתבצע בארבעה רבדים: ניטור תשתיות; ניטור לוגים ותצוגה גרפית; ניטור השירות (SLA); וניטור האפליקציה. באמצעות כלי הניטור המוטמעים בו, מערך כזה מתעד ומסווג את מכלול הדיווחים על אירועים, תופעות ותקלות שאותרו בשרתים, ברשת או בתפעול האפליקציה עצמה. כך מתקבל ניתוח מקיף וכולל של כל היבטי האופרציה של המערכת, בכל רגע נתון.
הודות לכך, ניתן לקבל החלטות ולספק פתרונות יעילים לתקלות פוטנציאליות באופן פרואקטיבי, בכל אחד מרובדי האופרציה, ולא רק להגיב בדיעבד לתקלות שמתרחשות בזמן אמת. רק באופן זה ניתן להבטיח אופרציה רציפה ומוצלחת של השירות שהחברה מספקת, ולכן הישענות על מערך NOC מתקדם משקפת ראייה עסקית נכונה של סוגיית הניטור.
על מנת למצות את יתרונותיו של מערך NOC חכם יש לשלבו עם חלוקת עבודה מרובדת בקרב אנשי ה-DevOps/Dev. במסגרת חלוקת עבודה כזו, מהנדסי NOC יתמקדו בטיפול בבעיות שמאותרות באמצעות מערך ה-NOC באופרציה השוטפת של המערכת, וכך יוכלו מהנדסי ה-DevOps/Dev המתמחים בפתרון בעיות ברמה יסודית יותר להתמקד בהצגת פתרונות תמיכה במישור זה ובהטמעת תהליכים אסטרטגיים שהארגון מעוניין ליישם.
השילוב בין מערך NOC חכם בעל רבדים שונים לבין חלוקת עבודה מרובדת בקרב צוות התמיכה, מאפשר לארגון לאתר תקלות קיימות ופוטנציאליות בצורה יעילה יותר, לתעדף נכון יותר את הטיפול בהן ולהגיב להן מהר יותר, מבלי לבזבז משאבים חיוניים של מהנדסי פיתוח.
בה בעת, ועל אף שהשימוש במערכות ניטור ייעודיות שמתמחות בכל אחד מרובדי הניטור טומן בחובו יתרון משמעותי, הדבר מאתגר את צוות ה-NOC, כיוון שיש מקורות רבים שצריך לעבוד איתם. לכן רצוי להטמיע לוח בקרה מרכזי שיאפשר לעבוד בצורה מרוכזת ויעילה יותר.
חשיבותו של ניטור אנושי בזמן אמת
מרכיב מכריע בחשיבותו בניהול שירות הניתן מסביב לשעון הוא ניטור בזמן אמת. לניטור כזה יש שני מאפיינים עיקריים. ראשית, מערך הניטור מותאם באופן מושלם לצורכי האופרציה של העסק הספציפי. שנית, על פעילות הניטור חולש גורם אנושי, על מנת להבטיח פתרונות זמינים בכל רגע נתון, לכל הבעיות שמאותרות במערכת, בכל רובדי הפעילות שלה.
יש לזכור, כי ניטור אוטומטי מספק פתרונות מוגבלים בלבד לבעיות שצצות או עלולות לצוץ במערכת. ניטור כזה מבוסס על ידע שנצבר עד לנקודת זמן מסוימת בעבר, בסביבת פעילות מסוימת. מטבע הדברים, אין בכך כדי לתת מענה לבעיות חדשות שלא נצפו בעבר ושלא הותאם להן פתרון הולם. במילים אחרות, תמיד צריך לנטר ולעדכן את פעילות הניטור עצמה, ואת זה ניתן לעשות רק באמצעות שירותי NOC אנושיים.
למותר לציין, שניטור בזמן אמת צריך להיות מדויק וממורכז ולהתבצע בכל אחד מרובדי האופרציה. רק ניטור ממורכז ורב-שכבתי מספק תמונת מצב אינטגרטיבית של האופרציה של המערכת, ובכך מעניק לארגון ביטחון ויציבות ואף מאפשר למקבלי ההחלטות להפנות את המשאבים האנושיים, הכישורים והידע העומדים לרשות הארגון לטיפול במשימות חיוניות אחרות מלבד ניטור.
בסופו של יום, רק ניטור בזמן אמת, הן של האפליקציה והן של התשתית שעליה היא נשענת, תוך התבססות על הערכות ותחזיות של גורם אנושי בסוגיות חיוניות, מבטיח אספקה רציפה וחלקה של שירותים. זהו ניטור שמשקף גישה מקצוענית ואסטרטגית, והוא מניב שדרוג מתמיד ברמת השירות, מאחר שהוא מאפשר להתאים את האופרציה בכל רבדיה, באופן מתמיד, לשינויים ועדכונים שמכתיב הענן.