// English version will follow //
Spécialiste de la surveillance TI
Reporte à : Chef technique, Administrateur système principal - Services aux groupes
Objectif : Administrer et superviser les services mondiaux de surveillance, d'alerte et de gestion des incidents .
Responsabilités :
• Être en charge des services mondiaux de surveillance et d'alerte internes
• Conseiller et coacher les équipes de service en ligne sur les services de surveillance et d'alerte externes
• Assurer la liaison avec l'équipe de gestion des services informatiques pour développer les meilleures pratiques en matière de gestion des incidents et de processus de réponse
• Piloter une stratégie de surveillance mondiale et développer des normes de conformité de surveillance
• Fournir une formation et un encadrement aux services informatiques pour déployer, configurer et gérer des systèmes de surveillance spécifiques aux équipes
• Gérer l'intégration des systèmes de surveillance dans les services de réponse aux incidents
• Créer, développer et améliorer des mesures de surveillance, des tableaux de bord, des escalades et des alertes nouveaux / existants
• Conseiller et superviser les exigences de surveillance pour les nouveaux projets
• Développer la surveillance existante des applications / services
• Participer aux revues post-incident pour auditer et améliorer la surveillance
Expériences et qualifications requises :
• + 2 ans d'expérience de la suite de surveillance SolarWinds Orion
• + 2 ans d'expérience de la solution de surveillance Prometheus
• Connaissance d'autres solutions d'analyse et de surveillance open source, tels que Grafana , Graphite, Elasticsearch
• • + 1 année d'expérience de la plateforme de réponse aux incidents PagerDuty
• Expérience de la surveillance des services de la plateforme cloud, tels que Azure , GCP, AWS
• Expérience des scripts PowerShell , Bash et Python
Expériences constituant un atout :
• Connaissance de la solution d’intelligence et de surveillance réseau ThousandEyes
• Connaissance d'autres outils de suivi, par ex. Zabbix, Observium , DataDog , Nagios, LANsweeper , Vmware vRealize
• Expérience de la surveillance des environnements de base de données, par ex. MSSQL, MySQL, MongoDB
• Connaissance des environnements Linux
• Connaissance des outils Atlassian , notamment JIRA et Confluence
Qualités interpersonnelles :
• Esprit d'équipe motivé avec une grande attention aux détails, de très bonnes compétences organisationnelles et la capacité à savoir prioriser la charge de travail
• Capacité d'analyser, de résoudre des problèmes et de travailler sous pression
• Expérience de travail autonome et sans supervision directe
• Adaptabilité et enthousias me
Motivations & intérêts :
• Intérêt pour les jeux
• Attitude adaptable et enthousiaste
-------------------------------------------------------------------------
IT Monitoring Specialist
Reports to: Senior System Administrator, Technical Manager – Group Services
Summary
Administer and oversee global monitoring, alerting and incident management services .
Responsibilities:
• Oversee global internal monitoring and alerting services
• Advise and coach Online Service teams around external monitoring and alerting services
• Liaise with IT Service Management team to develop best practice around incident management and response processes
• Drive global monitoring strategy and development of monitoring compliance standards
• Provide training and coaching to IT departments to deploy, configure and manage team-specific monitoring systems
• Manage integration of monitoring systems into incident response services
• Create, develop, and improve new/existing monitoring metrics, dashboards, escalations and alerts
• Advise on and oversee monitoring requirements for new projects
• Develop existing application/service level monitoring
• Participate in post incident reviews to audit and improve monitoring
Experiences and qualifications :
• 2+ years of experience of SolarWinds Orion monitoring suite
• 2 + years of experience of Prometheus monitoring solution
• Familiarity with other open source analytics & monitoring solutions, e.g. Grafana, Graphite, Elasticsearch
• 1+ years of experience of PagerDuty incident response platform
• Experience of monitoring cloud platform services, e.g. Azure, GCP, AWS
• Experience in PowerShell , Bash & Python scripting
Nice to have :
• Familiarity with ThousandEyes network intelligence & monitoring solution
• Familiarity with other monitoring tools, e . g . Zabbix, Observium , DataDog , Nagios, LANsweeper , Vmware vRealize
• Experience of monitoring database environments, e.g. MSSQL, MySQL, MongoDB
• Familiarity with Linux environments
• Familiarity with Atlassian tools including JIRA and Confluence
Interpersonal qualities :
• Self-motivated team player with great attention to details, superb organizational skills, and the ability to prioritize workload
• Ability to analyse, solve problems, and work well under pressure
• Experience working independently and without direct supervision
• Adaptable, enthusiastic attitude
Motivation & interest :
• Interest in gaming
• Adaptable, enthusiastic attitude