Site Reliability Expert (GCP)/Expert·e en fiabilité des sites

Sony Playstation
CAN-QC-Montreal-Place Ville Marie
13 days ago
Apply

Why PlayStation?

PlayStation isn’t just the Best Place to Play — it’s also the Best Place to Work. Today, we’re recognized as a global leader in entertainment producing The PlayStation family of products and services including PlayStation®5, PlayStation®4, PlayStation®VR, PlayStation®Plus, acclaimed PlayStation software titles from PlayStation Studios, and more.

PlayStation also strives to create an inclusive environment that empowers employees and embraces diversity. We welcome and encourage everyone who has a passion and curiosity for innovation, technology, and play to explore our open positions and join our growing global team.

The PlayStation brand falls under Sony Interactive Entertainment, a wholly-owned subsidiary of Sony Corporation.

//FRENCH FOLLOWS//

In May 2021, we embarked on a journey to start Haven Studios with a small team and big ambitions. Our goal was to build a studio where we could make the kind of games we’ve always wanted to create – and games we’ve longed to play.

We’ve made amazing progress in a short time thanks to our talented, passionate team and their exceptional contributions. We established a culture at Haven grounded in kindness, adaptability and courage that unlocks creativity. Our first new IP for PlayStation is on track to deliver a AAA multiplayer experience with a vision to build a systemic and evolving world focused on freedom, thrill, and playfulness that will keep players entertained and engaged for years.

Haven joined the PlayStation Studios family in 2022, and we are on track to build an exclusive new IP for Playstation and grow the first Sony game development team in Canada.

About the role

We are seeking a skilled and experienced Site Reliability Expert to join our Infrastructure and Operations SRE team and play a key role in ensuring the reliability, scalability, and performance of the cloud-based systems support our studio’s game production.

What you will do

  1. System Architecture and Design:
    • Collaborate with development teams to design, implement, and maintain a robust and scalable cloud core infrastructure.
    • Work on the architecture and deployment of critical services to ensure high availability and fault tolerance.
  2. Infrastructure as Code (IaC):
    • Utilize Infrastructure as Code principles to automate the provisioning, configuration, and management of cloud infrastructure components.
    • Implement best practices for IaC tools such as Terraform or similar technologies.
  3. Monitoring and Incident Response:
    • Develop and maintain comprehensive monitoring solutions to proactively identify and address potential issues.
    • Participate in on-call rotations and respond to incidents promptly, ensuring minimal downtime and impact on users.
  4. Performance and Resource Optimization:
    • Continuously optimize system performance and resource utilization, identifying areas for improvement and implementing solutions.
    • Conduct regular performance testing and capacity planning to meet growing business needs.
  5. Security and Compliance:
    • Collaborate with security teams to implement and enforce security best practices in the cloud infrastructure.
    • Ensure compliance with industry standards and regulatory requirements.
  6. Collaboration and Documentation:
    • Work closely with development teams to streamline the deployment process and improve overall system reliability.
    • Document system configurations, procedures, and best practices for knowledge sharing and training.
    • Participate and contribute to sprints with the team.
    • Assess and size effort associated with work backlog and participate in grooming.
    • Communicate effectively with team members, production and management to ensure that project goals and deadlines are met.

What you bring :

Bonus Qualifications

En mai 2021, nous sommes lancés dans la création de Haven Studios avec une petite équipe et de grandes ambitions. Notre objectif était de construire un studio où nous pourrions créer le genre de jeux que nous avons toujours voulu créer - et auxquels nous avons toujours rêvé de jouer ! Nous faisons désormais partie de la famille PlayStations Studios et nous sommes fiers d'avoir l'opportunité de créer une nouvelle propriété intellectuelle exclusive pour Playstation et de former la première équipe de développement Sony au Canada.

Nous avons fait des progrès étonnants en peu de temps grâce à notre équipe talentueuse et passionnée et à ses contributions exceptionnelles. Nous avons instauré chez Haven une culture fondée sur la bienveillance, l'adaptabilité et le courage qui libère la créativité. Notre première nouvelle propriété intellectuelle pour PlayStation est sur la bonne voie pour offrir une expérience multijoueur de niveau AAA, avec la vision de construire un monde systémique et évolutif axé sur la liberté, le frisson et le jeu, qui gardera les joueur·euse·s diverti·e·s et engagé·e·s pendant des années.

Haven a rejoint la famille des studios PlayStations en 2022, et nous sommes sur la bonne voie pour créer une nouvelle propriété intellectuelle exclusive pour Playstation et continuer de bâtir la première équipe de développement de jeux Sony au Canada

Nous sommes à la recherche d'un·e expert·e en fiabilité de site compétent·e et expérimenté·e pour rejoindre notre équipe SRE (Infrastructure et Opérations) et jouer un rôle clé en garantissant la fiabilité, l'évolutivité et la performance des systèmes basés sur le cloud qui soutiennent la production de jeux de notre studio.

Responsabilités et tâches

  1. Architecture et conception du système :
    • Collaborer avec les équipes de développement pour concevoir, mettre en œuvre et maintenir une infrastructure de base robuste et évolutive.
    • Travailler sur l'architecture et le déploiement de services critiques pour assurer une haute disponibilité et une tolérance aux pannes.
  2. Infrastructure as Code (IaC) :
    • Utiliser les principes de l'infrastructure en tant que code pour automatiser le provisionnement, la configuration et la gestion des composants de l'infrastructure en nuage.
    • Mettre en œuvre les meilleures pratiques pour les outils IaC tels que Terraform ou des technologies similaires.
  3. Surveillance et réponse aux incidents :
    • Développer et maintenir des solutions de surveillance complètes afin d'identifier et de traiter de manière proactive les problèmes potentiels.
    • Participer aux rotation d'astreinte et répondre rapidement aux incidents, en veillant à minimiser les temps d'arrêt et l'impact sur les utilisateurs.
  4. Optimisation des performances et des ressources :
    • Optimiser en permanence les performances du système et l'utilisation des ressources, en identifiant les domaines susceptibles d'être améliorés et en mettant en œuvre des solutions.
    • Effectuer régulièrement des tests de performance et planifier les capacités pour répondre aux besoins croissants de l'entreprise.
  5. Sécurité et conformité :
    • Collaborer avec les équipes de sécurité pour mettre en œuvre et appliquer les meilleures pratiques de sécurité dans l'infrastructure en nuage.
    • Assurer la conformité avec les normes industrielles et les exigences réglementaires.
  6. Collaboration et documentation :
    • Travailler en étroite collaboration avec les équipes de développement pour rationaliser le processus de déploiement et améliorer la fiabilité globale du système.
    • Documenter les configurations du système, les procédures et les meilleures pratiques pour le partage des connaissances et la formation.
    • Participer et contribuer aux sprints avec l'équipe.
    • Estimer l'effort associé aux tâches de backlog et participer à l'affinement de celui-ci.
    • Communiquer efficacement avec les membres de l'équipe, la production et la direction pour s'assurer que les objectifs et les délais du projet sont respectés.

Qualifications recherchées

Qualifications idéales

Equal Opportunity Statement:

Sony is an Equal Opportunity Employer. All persons will receive consideration for employment without regard to gender (including gender identity, gender expression and gender reassignment), race (including colour, nationality, ethnic or national origin), religion or belief, marital or civil partnership status, disability, age, sexual orientation, pregnancy or maternity, trade union membership or membership in any other legally protected category.

We strive to create an inclusive environment, empower employees and embrace diversity. We encourage everyone to respond.

PlayStation is a Fair Chance employer and qualified applicants with arrest and conviction records will be considered for employment.

Create Your Profile — Game companies can contact you with their relevant job openings.
Apply

Related Jobs

Senior Site / Database Reliability Engineer
AccelByte · Remote · 1 month ago
Site Reliability Engineer
AccelByte · Remote · 7 days ago
Site Reliability Engineer
Dapper Labs · Vancouver, British Columbia · 15 days ago
Principal Site Reliability Operations Engineer
Roblox · San Mateo, CA · 6 days ago
Site Reliability Engineer
Wargaming · Vilnius, Lithuania · 7 days ago
Senior Site Reliability Engineer
Xsolla · Kuala Lumpur, Malaysia · 8 months ago
Site Reliability Engineer
Xsolla · Beijing, China · 6 months ago
Site Reliability Engineer
Moon Active · Warsaw, Poland · 2 years ago
Infrastructure Site Reliability Engineer
Electronic Arts · Orlando, FL · 2 months ago
Site Reliability Engineer (Remote)
Hostari · Remote · 2 months ago
Site Reliability Engineer
Electronic Arts · Orlando, FL · 6 days ago
Senior Site Reliability Engineer (SRE)
Activision · Shanghai, China · 1 month ago

Jobs at Sony Playstation