உள்ளடக்கத்திற்கு செல்க

ஒரு சுவிட்ச் ரீஸ்டார்ட் வேண்டுமா? – நெட்வொர்க் ஊழியரின் பரபரப்பான அனுபவம்!

தொழில்நுட்ப ரீபூட்டுக்கான வலைப்பின்னல் பிரச்சினைகளை நிபுணர்கள் சினிமா பாணியில் ஆய்வு செய்கிறார்கள்.
இந்த சினிமா காட்சியில், வலைப்பின்னல் நிபுணர்கள் பிரச்சினைகளை தீர்க்கும் கடுமையான பணியை கையாள்கிறார்கள், அவர்கள் தொழில்நுட்பத்தின் வெளிப்பாடும் அவசரத்தையும் பிரதிபலிக்கிறார்கள்.

"நம்ம ஊர்ல அந்த பக்கத்து வீட்டு மின்சாரம் போனாலே எல்லாரும் 'மெயின் சுவிட்ச்' ஆப் பண்ணுவாங்க, பின் திரும்ப ஆன் பண்ணுவாங்க. ஏன்? அதிலயே பிரச்சினை தீரும் நம்பிக்கை! ஆனா, ஒரு பெரிய மருத்துவமனையில் நெட்வொர்க் சுவிட்ச் ரீஸ்டார்ட் பண்ணுறது, அது மாதிரி சாதாரண விஷயம் இல்ல. இன்று நம்ம பார்க்கப்போகும் கதை, அப்படிப்பட்ட ஒரு பரபரப்பான IT அனுபவம்!"

உங்களுக்குத் தெரியும் அல்லவா, மருத்துவமனையில் நெட்வொர்க் டவுன் ஆகிச்சுன்னா, அது சாதாரணமாக முடியும் விஷயம் கிடையாது. ரெண்டு நிமிஷம் பிச்சி போனால், நோயாளிகளும், டாக்டர்களும், எல்லாரும் காத்திருக்கணும். அந்த நிலைமையில தனியாக ஒரு நெட்வொர்க் டெக்னீஷியன் எடுக்க வேண்டிய முடிவு, அவங்க மேலுள்ள மேலாளர்கள், நெட்வொர்க் இன்ஜினியர்கள் யாரும் இல்லாம போன நேரம்… சொல்லவே வேண்டாம்!

"ஏன் இது நடக்குது?" – பிரச்சினையின் தொடக்கம்

ஒரு பெரிய கிளினிக்கில் அரை ஊழியர்களுக்கும், டாக்டர்களுக்கும், ஆபிஸில் உள்ள கணினிகளுக்கும், போன்களுக்கும் நெட்வொர்க் வேலை செய்யவில்லை. "அம்மா, எல்லா போனும் டெடா ஆகிடுச்சு, கணினியில் லாகின் ஆக முடியல", என்று கிளினிக் மேனேஜர் அழைக்கிறார்.

அந்த இடத்தில் எல்லா கணினிகளும் VDI-யில் இயக்கப்படுது – நம்ம ஊரில் சொல்வது போல, கணினி தான் ஸ்டேஷன்ல இருக்கு ஆனா, எல்லாம் ரிமோட் டேட்டா சென்டரில் ஓடுது. Dell Wyse Terminal, ThinOS, PoE phone, பிரிண்டர் – அப்படின்னு பல டெக்னிக்கல் வசதிகள்.

பிரச்சினை என்னன்னு கவனிக்க ஆரம்பித்தார் நம்ம ஹீரோ. நெட்வொர்க் மேனேஜ்மென்ட் டூல் பார்த்தார். எல்லா ரவுடரும், சுவிட்சும் ஆன்லைன்ல தான் இருக்கு. ஆனா, affected ஆன Wyse Terminals கு MAC address டேபிள்லே இல்லை! WAN எல்லாம் ஓகே, ஆனா ஒரு சுவிட்ச் மட்டும் LAN interfaces டவுன் ஆகிடுச்சு. ஒரே நேரத்தில் பல போர்ட் டவுன் – இது ஒரு பெரிய மர்மம்!

கொஞ்சம் ஆராய்ச்சிக்கு பிறகு, SysLog-ல் ஒரு குறிப்பு:

"%ILPOWER-5-IEEE_DISCONNECT: Interface Gi1/0/9: PD removed %ILPOWER-3-CONTROLLER_PORT_ERR: Power Controller reports power Tstart error detected"

அந்த Tstart error-ஐ பற்றி நெட்வொர்க் கம்யூனிட்டி தளங்களில் தேடினால், PoE power பிரச்சினை என்று தெரிந்தது.

இதோ, புள்ளி விளக்கு! அந்த கிளினிக்கில் Wyse terminals, PoE போனில் Ethernet passthrough-க்கு depend பண்ணுது. போன்-க்கு power போனாலே, அதனுடன் கணினிக்கும் போயிடும்.

"தீவிர முடிவு" – பதட்டமும் பொறுப்பும்

இப்போ பிரச்சினை என்னன்னு கண்டுபிடிச்சாச்சு – சிச்கோ சுவிட்ச் PoE power கொடுக்க மறந்துருக்கு! ஆனா, நெட்வொர்க் இன்ஜினியர்கள் எல்லாம் வேறு பெரிய பிரச்சினையில் பிஸி. மேலாளர்கள் எல்லாம் மீட்டிங்கில். நம்ம ஹீரோ தனக்கே முடிவு பண்ணணும்.

இப்போ இரட்டை வழி – "இப்பவே சுவிட்ச் ரீபூட் பண்ணலாம், முடியும்னு நம்பிக்கையோட, இல்லைனா மேலாளர்கள் வரைக்கும் காத்திருக்கலாம்." ஆனா, நோயாளிகள் காத்திருக்கிறார், டாக்டர்கள் கை கட்டி நிற்கிறார். அவர்களுக்காக ஒரு முடிவு எடுத்தார் – ரிஸ்க் எடுத்தார்.

"சுவிட்ச் ரீஸ்டார்ட் பண்ணுங்க!" – கிளினிக் மேனேஜரை அழைத்து, power plug-ஐயே உதிர்த்தார். (நம்ம ஊர்ல யாரும் OOBM கிடையாது, onsite-க்கு போக முடியாது – power plug தான் வழி!)

"சின்ன தவறு, பெரிய பாடம்" – பின்னணியில் நடந்தது

சுவிட்ச் ரீஸ்டார்ட் ஆனது, ஆனா, சுவிட்ச் திரும்ப ஆன்லைன்ல வரவே இல்ல! நம்ம ஹீரோ பதட்டம், "ஏன் இது வரல?" என்று காத்திருக்கிறார். கிளினிக் மேனேஜர் மீண்டும் அழைக்க, சில computers கூட வேலை செய்யவில்லை என்று சொன்னார். இது முன்னாடி பாதிக்கப்படாத இடம்!

அவசரமாக, affected computers யாருக்கு என்ன wall-port என்று கண்டுபிடிக்கச் சொன்னார். அந்த மேனேஜர், கை 떨ையாம, எல்லா கேபிளையும் பின்தொடர்ந்து, மூன்று டெஸ்க்கும் சரியாக இணைத்தார். பத்து நிமிஷத்தில வேலை முடிந்தது – ஒரு பெரிய செயல்!

இந்த இடத்தில், ஒரு ரொம்ப முக்கியமான கருத்தை ஒரு கமென்டர் சொன்னார் – "நல்ல documentation, rack-க்கு ‘as-built’ photos இருந்தது, நல்ல தொழில்நுட்ப மேலாண்மை தான்." (நம்ம ஊர்ல, ‘சிறிது முன்னோக்கி சிந்தனை’ என்று சொல்வோம்.)

மேலாளர் வந்ததும், "நீ என்ன பண்ணின?" என்று கிளிப்பில் கேட்டாராம்! ஆனாலும், விபரங்கள் சொன்னதும், "சரி, மேல மேலாளர்களிடம் பேசுவோம். நீங்க சரியான முறையில் ஹேண்டில் பண்ணதுக்கு நன்றி," என்று கூறினார்.

"இந்த அனுபவம் என்ன சொல்லுது?" – கருத்துகளும், கலகலப்பும்

Reddit வாசகர்கள் பல பேர், "உங்க முடிவு சரிதான், இந்த மாதிரி நேரத்தில் நாமும் அப்படித்தான் செய்வோம்," என்று ஆதரவாக எழுதியிருக்கிறார்கள். ஒரு கமென்டர், "நீங்க சற்று பைத்தியம் மாதிரி தான், ஆனா சூப்பர்! நல்ல டெடக்டிவ் வேலை," என்று கலகலப்பாக சொல்லியிருக்கிறார்.

"பல மேலாளர்கள் ஒரே நேரத்தில் unavailable ஆகக்கூடாது" – இதுதான் மேலாண்மைக்கு கிடைத்த முக்கியமான பாடம் என்று அங்குள்ள ஒருவரும் சொன்னார். இது நம்ம ஊர்லயும் பொருந்தும் – ‘மாடிக்குள் கோழி பிடிக்கவேண்டுமானால்...’ என்று பழமொழி சொல்வாங்க!

மற்றொரு வாசகர், "சில நேரம் ரிஸ்க் எடுக்க வேண்டியதுதான், இல்லையென்றால் வேலை போய்க்கொண்டே இருக்கும்," என்று கூறியிருக்கிறார். இன்னொரு வாசகர், "எப்போதும் சரியான documentation, முன்னேற்பாடு இருந்தால், பெரிய பிரச்சினை கூட எளிதாக தீர்க்கலாம்" என்று பாராட்டினார்.

முடிவும், சின்ன சிந்தனையும்

இந்த அனுபவம் மூலம் நம்ம ஹீரோவும், மேலாண்மையுமானும், முக்கியமான பாடம் கற்றுக்கொண்டார்கள் – சில நேரங்களில் தைரியமான முடிவு எடுத்தால், அது தவறு ஆகலாம்; அதற்கு பிறகு அதை நேர்மையோடு சமாளிப்பதும், அனுபவமாக எடுத்துக்கொள்வதும் தான் முக்கியம்.

"நான் மீண்டும் இப்படிச் செய்ய மாட்டேன்," என்று ஹீரோ சொல்கிறார். ஆனால், அடுத்த முறையில் மேலாளர்கள், நெட்வொர்க் இன்ஜினியர்கள் எப்போதும் ஒரு பக்கத்தில இருப்பாங்க, புரியுமா?

நம்ம ஊர்லயும், டெக்னிக்கல் பிரச்சினை வந்தா, முதலில் "restart பண்ணிங்களா?" என்று தான் கேட்போம். ஆனா, பெரிய நிறுவனங்களில அது ஒரு பெரிய பதட்டம், பொறுப்பு, அனுபவம்!

உங்களுக்கும் இப்படிப்பட்ட IT பிரச்சினை அனுபவங்கள் இருந்தால், கீழே கமெண்டில் பகிருங்கள்! இந்த மாதிரி சுவாரஸ்யமான டெக் கதைகள் விரைவில் மீண்டும் உங்களுக்காக!

– நன்றி, உங்கள் பக்கத்து நெட்வொர்க் அண்ணன்


அசல் ரெடிட் பதிவு: The Switch Needed a Reboot