תיעוד רטרואקטיבי

מאת Danbert
בתאריך 24 אוגוסט, 2014

אחת הדילמות המטרידות ביותר בתהליך ניהול התקלות עוסקת בתיעוד רטרואקטיבי. כלל, השאיפה היא לתעד את התרחשות התקלות בזמן אמת, ועל סמך הנתונים הנרשמים בזמן אמת. דבר זה מאפשר גם אמינות גבוהה יותר של הנתונים, כי תיעוד אוחר של התקלות עלול לא מדוייק, הן בשל שכחה והן בשל האפשרות לטיוב מגמתי של הנתונים. השאלה המתעוררת היא: האם לאפשר תיעוד רטרואקטיבי, לאילו צוותים ובאילו מקרים?

תיעוד רטרואקטיבי

אחת הדילמות המטרידות ביותר בתהליך ניהול התקלות עוסקת בתיעוד רטרואקטיבי. כלל, השאיפה היא לתעד את התרחשות התקלות בזמן אמת, ועל סמך הנתונים הנרשמים בזמן אמת. דבר זה מאפשר גם אמינות גבוהה יותר של הנתונים, כי תיעוד אוחר של התקלות עלול לא מדוייק, הן בשל שכחה והן בשל האפשרות לטיוב מגמתי של הנתונים. השאלה המתעוררת היא: האם לאפשר תיעוד רטרואקטיבי, לאילו צוותים ובאילו מקרים?

דרישה לתעד זמני טיפול יכולה לנבוע משיטות עבודה ייחודיות של צוותים טכניים מסויימים:

  • תשתית שו"ב ללא ממשק - חלק מהצוותים המנהלים אירועים ומטפלים בתקלות בזמן אמת מתעדים את התקלה בעיכוב מסויים, מרגע שזוהתה על ידי תשתית שו"ב. ודאי שזמני התחילה והסיום של התקלה המהימנים ביותר מקורם בתשתית שו"ב, אך בהיעדר ממשק המאפשר דיווח אוטומטי ישירות מתשתית שו"ב למערכת ניהול התקלות, תמיד יתועדו התקלות באיחור מסוים.
  • פעילות זמן אמת - ישנם צוותים טכניים שתכליתם ללוות פעילויות מיוחדות באופן צמוד ולתקן תקלות שמתעוררות במהלכן בזמן אמת, כך שאינם מסוגלים להקדיש תשומת לב גם לתיעוד התקלה.
  • צוותים בשטח - ישנם צוותים שתפקידם לנוע בין אתרים שונים ולתקן תקלות בשטח, כאשר הגורם המשלח (חדר הבקרה) מצוי עימם בקשר טלפוני. בחלק מן הארגונים, אין באפשרות הטכנאים בשטח לתעד את התקלות בזמן אמת בשל שיקולים של אבטחת מידע, ועל כן הם נאלצם לעשות זאת רק בשובם למשרד.

במקרים אלו, ניתן ואף רצוי לאפשר לצוות לתעד תקלות באופן רטרואקטיבי, אך יש לעשות זאת במשנה זהירות, על מנת לשמור על אמינות הנתונים בכללותם. על כן, מתן האפשרות לתיעוד רטרואקטיבי צריך להיעשות תוך הקפדה על הכללים הבאים:

  • הגבלת הרשאות - יש לוודא כי רק לאותם צוותים שבאמת זקוקים לכך יתאפשר תיעוד רטרואקטיבי. הגבלה זו תוכל להבטיח שלא ייעשה שימוש ביכולת זו מעבר לדרוש.
  • אימות נתונים - יש לאכוף תלויות בין השדות במסכים (לדוגמה: זמן תחילה חייב להיות מוקדם סיום), ולקחת בחשבון מצבים שבהם רק חלק מן השדות הרטרואקטיביים הוזנו. זאת במטרה למנוע מצבים שבהם מערכת המדידה מחשבת משך תקלה שלילי. חשוב גם לעדכן את נוסחת חישוב משך התקלות (MTTR/MTRS) לפי השדות הרטרואקטיביים.
  • לוגים - תיעוד רטרואקטיבי יכול ליצור פערים בין חישוב משך התקלה הכולל, לבין משך השהייה של התקלה בצוות מסויים או בסטאטוס מסויים. אמנם בחישוב התקלה כולה יש להתחשב בשדות הרטרואקטיביים אולם חישוב משך השהייה של תקלה בצוות מסויים או בסטאטוס מסויים מבוסס בדרך כלל על הלוגים שנרשמים בזמן אמת (פעולות שינוי סטאטוס והעברות בין צוותים) ואותם לא ניתן לערוך רטרואקטיבית. זהו פער שצריך לקחת אותו בחשבון.
  • צורת דיווח - מומלץ כי לתקלות שתועדו רטרואקטיבית תוגדר צורת דיווח ייחודית, שמבדילה אותן מתקלות "רגילות", כך שניתן יהיה לדעת בכל רגע בקלות מהו אחוז התקלות שמתועד באופן רטרואקטיבי. זהו נתון שצריך להכיר אותו ולהתחשב בו במסגרת מגבלות המדידה, כאשר מציגים מדדים בשגרות ניהוליות.
מאמרים נוספים...