This job might no longer be available.

Spécialiste de la surveillance TI / IT Monitoring specialist

Eidos

Montréal, Québec, Canada

3 years ago

Apply

// English version will follow //

Spécialiste de la surveillance TI

Reporte à : Chef technique, Administrateur système principal - Services aux groupes

Objectif : Administrer et superviser les services mondiaux de surveillance, d'alerte et de gestion des incidents .

Responsabilités :

• Être en charge des services mondiaux de surveillance et d'alerte internes

• Conseiller et coacher les équipes de service en ligne sur les services de surveillance et d'alerte externes

• Assurer la liaison avec l'équipe de gestion des services informatiques pour développer les meilleures pratiques en matière de gestion des incidents et de processus de réponse

• Piloter une stratégie de surveillance mondiale et développer des normes de conformité de surveillance

• Fournir une formation et un encadrement aux services informatiques pour déployer, configurer et gérer des systèmes de surveillance spécifiques aux équipes

• Gérer l'intégration des systèmes de surveillance dans les services de réponse aux incidents

• Créer, développer et améliorer des mesures de surveillance, des tableaux de bord, des escalades et des alertes nouveaux / existants

• Conseiller et superviser les exigences de surveillance pour les nouveaux projets

• Développer la surveillance existante des applications / services

• Participer aux revues post-incident pour auditer et améliorer la surveillance

Expériences et qualifications requises :

• + 2 ans d'expérience de la suite de surveillance SolarWinds Orion

• + 2 ans d'expérience de la solution de surveillance Prometheus

• Connaissance d'autres solutions d'analyse et de surveillance open source, tels que Grafana , Graphite, Elasticsearch

• • + 1 année d'expérience de la plateforme de réponse aux incidents PagerDuty

• Expérience de la surveillance des services de la plateforme cloud, tels que Azure , GCP, AWS

• Expérience des scripts PowerShell , Bash et Python

Expériences constituant un atout :

• Connaissance de la solution d’intelligence et de surveillance réseau ThousandEyes

• Connaissance d'autres outils de suivi, par ex. Zabbix, Observium , DataDog , Nagios, LANsweeper , Vmware vRealize

• Expérience de la surveillance des environnements de base de données, par ex. MSSQL, MySQL, MongoDB

• Connaissance des environnements Linux

• Connaissance des outils Atlassian , notamment JIRA et Confluence

Qualités interpersonnelles :

• Esprit d'équipe motivé avec une grande attention aux détails, de très bonnes compétences organisationnelles et la capacité à savoir prioriser la charge de travail

• Capacité d'analyser, de résoudre des problèmes et de travailler sous pression

• Expérience de travail autonome et sans supervision directe

• Adaptabilité et enthousias me

Motivations & intérêts :

• Intérêt pour les jeux

• Attitude adaptable et enthousiaste

-------------------------------------------------------------------------

IT Monitoring Specialist

Reports to: Senior System Administrator, Technical Manager – Group Services

Summary

Administer and oversee global monitoring, alerting and incident management services .

Responsibilities:

• Oversee global internal monitoring and alerting services

• Advise and coach Online Service teams around external monitoring and alerting services

• Liaise with IT Service Management team to develop best practice around incident management and response processes

• Drive global monitoring strategy and development of monitoring compliance standards

• Provide training and coaching to IT departments to deploy, configure and manage team-specific monitoring systems

• Manage integration of monitoring systems into incident response services

• Create, develop, and improve new/existing monitoring metrics, dashboards, escalations and alerts

• Advise on and oversee monitoring requirements for new projects

• Develop existing application/service level monitoring

• Participate in post incident reviews to audit and improve monitoring

Experiences and qualifications :

• 2+ years of experience of SolarWinds Orion monitoring suite

• 2 + years of experience of Prometheus monitoring solution

• Familiarity with other open source analytics & monitoring solutions, e.g. Grafana, Graphite, Elasticsearch

• 1+ years of experience of PagerDuty incident response platform

• Experience of monitoring cloud platform services, e.g. Azure, GCP, AWS

• Experience in PowerShell , Bash & Python scripting

Nice to have :

• Familiarity with ThousandEyes network intelligence & monitoring solution

• Familiarity with other monitoring tools, e . g . Zabbix, Observium , DataDog , Nagios, LANsweeper , Vmware vRealize

• Experience of monitoring database environments, e.g. MSSQL, MySQL, MongoDB

• Familiarity with Linux environments

• Familiarity with Atlassian tools including JIRA and Confluence

Interpersonal qualities :

• Self-motivated team player with great attention to details, superb organizational skills, and the ability to prioritize workload

• Ability to analyse, solve problems, and work well under pressure

• Experience working independently and without direct supervision

• Adaptable, enthusiastic attitude

Motivation & interest :

• Interest in gaming

• Adaptable, enthusiastic attitude

Create Your Profile — Game companies can contact you with their relevant job openings.

Apply