איתור תקלות ברשתות ארגוניות

בתאריך 6 אוקטובר, 2009

תכנון רשתות תקשורת, איתור תקלות ברשתות ארגוניות, אופטימיזציה של רשתות. המטרה של בלוג זה הינה לתת במה לאנשי תקשורת ואבטחת מידע, וזאת עבור שיפור הרשתות של כולנו.

איתור תקלות ברשתות ארגוניות

לכל אחד מאיתנו, מנהל מערכות מידע או מנהל מחשוב, ידועה התופעה של משתמשים המתלוננים על "הרשת שאינה עובדת". תלונות על "ניתוקים", "עבודה איטית", "אפליקציה שלא זזה" ורבות אחרות, מדירות לא מעט שינה מעיננו. מצד שני, כשאנו פונים לפתרון הבעיה, יציעו לנו "בדיקת סניפר", "הקמת מערכת בקרה (במחיר אסטרונומי)", ועוד. סדרת מאמרים זו, שבא אנו פותחים, באה לתת כלים בסיסיים לכל מנהל רשת ומחשוב לאיתו תקלות בארגונו. בהמשך הסדרה יובאו גם מאמרים בנושאי תכנון רשתות.

 

מה השיטות הקיימות לאיתור תקלות? איך לנטר רשת בצורה יעילה וזולה? איך לקבל אינדיקציה ראשונית היכן הבעיה ברשת, והאם צריך לקרוא למומחה? מטרת מאמר זה הינה לתת סקירה ראשונית  של האמצעים הקיימים, שיטות ודרכי בדיקה. במאמרים בהמשך הסדרה, יינתנו סקירות מעמיקות יותר על כל כלי בנפרד, כולל כלי שליטה ובקרה ו- SNMP, נתחי פרוטוקולים (Wireshark), ניטור באמצעות ציודי התקשורת עצמם ועוד.

 

קודם כל, בואו נבהיר דבר אחד חשוב, שאולי יישמע לרובינו מוזר: הבעיה בד"כ אינה ברשת התקשורת. מניסיוננו אנו יודעים, כי אם ניקח מאה תקלות של ניתוקים, עבודה איטית, או כל תופעת "הרשת לא עובדת" אחרת, בסביבות 50-60% מהבעיות יהיו בעיות אפליקטיביות, 30-40% בעיות מחשוב, ורק  בסביבות 10-20% מהבעיות יהיו בעיות תקשורת. למרות זאת, הרבה מהבעיות  הינן בעיות משולבות, בהן אפליקציה לא עובדת בצורה יעילה עם המשאבים של הרשת, חוסר זיכרון או מעבד איטי בשרת גורמים לעומס על הרשת וכד'.

 

והדוגמאות לכך הם רבות. לדוגמא, באחת ממערכות הבחירות המקדימות האחרונות למפלגות, הייתה עבודה איטית מאוד מול שרת הבחירות, באופן שעיכב בצורה משמעותית את ההצבעה. בבדיקת רשת שנערכה באמצעות נתח פרוטוקולים, התברר כי מערכת ההצבעה (המחשב בעמדת הקלפי) שולח ומקבל כ- 60 מנות (Packets) מולל השרת, עבור כל בוחר שמגיע לקלפי. לכשעצמה, זוהי כמות מידע זניחה, שלא אמורה להשפיע על הרשת, ואכן לפי חישובי רוחב פס שנעשו, לא הייתה אמורה להשפיע. הבעיה הייתה, שבאתרים שחוברו במודם סלולארי בטכנולוגיית cdma1x, ה- Delay (RTT) על הקו היה כ- 300mS, מה שגרם ל- 60 מנות לעבור ברשת ב- 60*300mS, כלומר 18 שניות באופן תיאורטי, שמעשית לקח יותר מפי שניים מזה, ומצביעים נתקעו בתורים עקב כך. התקלה תוקנה תוך כדי עבודה, והחל משעות אחה"צ ביום הבחירות, מהירות העבודה שופרה משמעותית. תקלה זו למשל, הינה דוגמא למערכת בסיס נתונים שתוכננה לעבוד ברשתות קוויות, בהן נבדקה ועבדה בצורה תקינה, אבל ברשת סלולארית, מדור 2.5, העבודה השתבשה לחלוטין.

 

לפני שאנו באים לבדוק רשת תקשורת, מספר מילים על מתודולוגיית הבדיקה. המתודולוגיה שבא אנו משתמשים, פשוטה מאוד, ומתבססת על מודל בדיקות, כלים, והבנה מעמיקה של אופן פעולת רשת תקשורת.

מאמרים נוספים...