A Odisséia de Observabilidade de Sofia: então você quer ser um SRE?
Lauren reencontra Raul no metrô e a conversa vira um guia de carreira — o que é SRE, o que é DevOps, o roadmap.sh e o caminho prático de sysadmin a engenheiro de confiabilidade, terminando em "só um git push".

Era um final de tarde de sexta-feira. Lauren estava no metrô voltando para casa. Ela ouvia música em seu celular quando, Raul, um antigo colega de faculdade, tocou em seu ombro.
- "Oi...? Caraca, Raul! Haha, quanto teeempo?" exclamou Lauren.
- "Graaande Laaauren! Quem é vivo sempre aparece haha!" respondeu Raul, aproximando-se. "Eu tô na correria como sempre. Como vai essa força? Tá com essa cara de juvenil de sempre, hein haha," disse Raul, rindo.
- "Ah vá, só a cara, chegando nos 30 já já," respondeu Lauren.
- "Se prepara que depois dos 30 é ladeira abaixo. Olha só pra mim, eu preciso resolver minha saúde também, daqui a pouco tô nos 40. Médico já tá pegando no meu pé haha," comentou Raul, sem graça. "Mas diz aí, como tá a vida de dev java?"
- "Ih, se foi, ao menos em partes haha. Hoje eu tô atuando como SRE. E você, como tá? Continua naquela vida de servidores, datacenter e etc? E a Rosana e as crianças, tão bem?" perguntou ela.
- "Vish, nem me fale. Eu tô vendo que vou me aposentar naquele lugar kkkk!" Raul deu uma risada acanhada. "Mas olha, foi bom te encontrar por aqui, viu? Eu tô mesmo querendo sair dessa vida de administrador de sistemas de empresinha de datacenter pequeno. Eu tô estudando na medida do possível, né? A Duda e o Gustavinho estão com 2 e 4 anos já, então eu consigo ter mais tempo pra focar nisso. A Rosana conseguiu terminar o curso de enfermagem dela e já tá trampando também, aí eu preciso correr atrás agora."
- "Nossa, que bacana, hein!? Fico feliz demais por vocês estarem conseguindo se virar na correria," disse Lauren, surpresa.
- "Mas então, me dá umas dicas aí de como eu posso dar uma melhorada na carreira, o que você me recomenda pra estudar e começar a mexer com essas coisas aí tipo DevOps, SRE?"
- "Mas então, tenho duas respostas, uma curta e uma longa," disse Lauren enquanto olhava para o teto, pensativa. "A primeira e mais simples: vai no canal de YouTube do Linuxtips. O Jefferson fala sobre DevOps, SRE, agora bastante sobre Platform Engineering e mais um monte de coisa. Não tem erro. Mas eu confesso que não sei se ele tem um guia inicial, algo que é recomendado para pessoas novas que chegam no canal dele, tipo um índice, sabe?"
- "Ah, o mano Badtux! Ele é brabo mesmo. Já assisti uma coisa ou outra de Docker dele quando eu tava estudando. Ele é muito bom porque ele é gente como a gente, né?" comentou Raul.
- "Haha, sim. Não parece um professor de curso meia boca falando, né?" respondeu Lauren, rindo.
- "Mas e a resposta longa? Não vai me recomendar aqueles
bootcamps
de 6 meses, né? Não tenho grana pra isso kkkk!" perguntou Raul, rindo. - "Hahahaha, nãaao, fica de boa. Vamos lá..." respondeu ela.
Antes de começarmos... SRE, DevOps, o que significa tudo isso?
Site Reliability Engineering

Site Reliability Engineering (SRE, ou Engenharia de Confiabilidade de Sites), é uma disciplina que incorpora aspectos da engenharia de software e os aplica a problemas de infraestrutura e operações. Os principais objetivos são criar sistemas de software escaláveis e altamente confiáveis. Ela se originou no Google quando eles incumbiram uma equipe de engenheiros de software de tornar uma infraestrutura automatizada já estabelecida mais confiável.
O papel de um SRE é multifacetado: eles podem estar envolvidos no design de sistemas, escrevendo código e automatizando tarefas de operações. Eles trabalham de perto com as equipes de desenvolvimento de produtos para projetar e apoiar sistemas escaláveis e confiáveis. Usando uma combinação de engenharia de software, engenharia de sistemas e um conjunto de processos bem definidos, os SREs visam alcançar um equilíbrio entre confiabilidade, disponibilidade e alto desempenho.
Em suas tarefas diárias como SRE, você utilizaria seu conhecimento tanto em codificação quanto em administração de sistemas, com um foco acentuado em automação e na melhoria da confiabilidade de sistemas e serviços. O papel também envolve frequentemente a definição de Objetivos de Nível de Serviço (SLOs) para ajudar a medir a confiabilidade e o desempenho do sistema.
E DevOps...?

DevOps é uma abordagem colaborativa que une as equipes de desenvolvimento de software (Dev) e operações de TI (Ops) para melhorar a eficiência, agilidade e qualidade na entrega de software. Esta prática enfatiza a automação, a integração contínua e a entrega contínua (CI/CD), permitindo que as mudanças de código sejam testadas e implementadas rapidamente.
O objetivo do DevOps é criar um ciclo de feedback rápido e contínuo, promovendo uma cultura de colaboração, comunicação e responsabilidade compartilhada entre desenvolvedores e operadores. Isso resulta em software mais confiável, menos tempo de inatividade e uma resposta mais rápida às necessidades do mercado e dos usuários.
Antes de mergulhar nas habilidades técnicas, é crucial entender o que um SRE faz. SREs aplicam princípios de engenharia de software a problemas de infraestrutura e operações. Eles se concentram em construir sistemas confiáveis, automatizar tarefas e garantir a escalabilidade e a disponibilidade dos aplicativos e serviços. A função conecta as equipes de desenvolvimento e operações, promovendo uma cultura de colaboração e melhoria contínua.
- "Mas diz aí, já sei que você tem toda uma bagagem de infraestrutura, redes, performance de servidores, observabilidade também, mas e a programação? Como tá?" perguntou Lauren.
- "Então, tô manjando bem já de fazer integrações e consultas em API, tudo certinho, usando Python. Lá no trampo agora tamo automatizando tudo em Python, sabe? Chega de fazer coisa na mão, não tem quem aguente a correria quando dá problema hahaha!" disse Raul, rindo.
- "Legal, pois o papel do engenheiro de confiabilidade é bizarro, pra dizer o mínimo. Você precisa ter uma boa noção de muita coisa, na real não de tanta coisa assim, apenas o suficiente para dar conta do dia a dia do ambiente que a sua empresa opera," afirmou Lauren. "Cê já viu aquele site onde tem um roadmap que serve como um ótimo guia da área de SRE/DevOps? É o https://roadmap.sh/devops. É bem simples e fácil de se guiar. Pode parecer confuso e muita coisa no começo, mas o ideal é dar um passo de cada vez," complementou ela.
Roadmap sugerido por Lauren

- "Nossa, top demais! Mas o que você me recomenda focar nesse começo?" perguntou Raul.
- "Hmmm, vamos dividir em porcentagem. Os teus 50% de operações e infraestrutura você já tem. O que eu recomendo agora é você aprender como funciona o fluxo de desenvolvimento de uma aplicação web, desde a escrita do código até ele chegar na nuvem," respondeu Lauren.
- "Escreva mais. Pratique, pega uma integração com API de rede social e faz um teste, ou um site que possua uma API aberta e legal. A linguagem de programação é a base pra muita coisa nessa nossa carreira," complementou ela. "Agora sobre o fluxo desse código até chegar na nuvem, você tem ideia de como automatizar tudo isso?" perguntou Lauren.
- "Ah, tô ligado. Tenso, hein. Esse ciclo completo assim eu não manjo não. Fazer uma pipeline do zero e etc." comentou Raul.
- "Eu vou te dar um exemplo. Me perguntaram numa entrevista uma vez se eu sabia fazer toda uma automação, pra colocar uma simples aplicação web no ar, com apenas um comando. O código saindo da máquina do desenvolvedor e chegando em produção com apenas um clique ou um comando. E na época eu não sabia fazer isso. Mas com todo um fluxo de automação, é possível fazer esse tipo de coisa," disse Lauren. "Bom, vamos lá."
Ela se preparou para começar a gesticular como uma "garota do tempo". Lauren inclinou-se para frente, seu rosto iluminando-se com uma antecipação ansiosa para compartilhar uma dica experiente.
" Tudo bem, aqui é onde você começa. Aprenda a colocar uma aplicação web, qualquer uma, numa nuvem como a AWS, por exemplo. Quando tiver controle sobre isso, comece a dar uma incrementada na automação usando ferramentas como Ansible e Terraform. Tudo o que você precisar fazer na mão, editar um arquivo de configuração, parâmetros, automatize. Mas não pare por aí. Escale ainda mais a automação com ArgoCD, Gitlab, Drone ou qualquer coisa que faça CI/CD."
Ela gesticulava enquanto falava, suas palavras pintando um caminho dinâmico no mundo da tecnologia. "Você tem muitas opções para rodar sua aplicação; você pode optar pelo AWS Lambda, ou explorar o ECS ou até mesmo o EKS Fargate. O objetivo final aqui é automatizar tudo de tal forma que tudo funcione perfeitamente logo após um ‘git push’."
- "Só um git push?" perguntou Raul.
- "Só um git push," respondeu Lauren.

Dando uma respirada, ela continuou com um tom de ênfase, "E nessa jornada, nunca ignore a observabilidade e a segurança. Elas não são meras opções, mas pilares essenciais. Integrando essas no seu setup, você vai criar um sistema redondinho."
Ela se recostou. "Quando você se encontrar em uma entrevista e eles fizerem perguntas como ‘Como você escalaria isso para X réplicas?’ ou te pressionarem sobre estratégias de backup, você vai estar em casa, mano, tendo já testado e implementado todo esse fluxo em seus testes. Não se trata apenas de responder às perguntas, Raul. É sobre demonstrar uma abordagem proativa onde você antecipa as necessidades e demandas de um sistema antes mesmo de serem apontadas, passando confiança e familiaridade com tudo isso, sacou?" Lauren complementa.
- "Top demais!" exclamou Raul. "Agora tá mais do que claro o que preciso fazer. E uns brothers recomendando pagar curso e tals, nada a ver, né?" questionou ele.
- "Aprendizado varia de pessoa pra pessoa, Raulzito. Tem gente que coloca a cabeça em livros e conteúdo online e se vira bem sozinho; tem gente que só em curso mesmo, de forma coletiva, discutindo, perguntando, sendo respondido ali na hora. Vai no que funciona pra você," respondeu Lauren calmamente.
- "É verdade, né? Cada um é cada um," comentou Raul.
- "Mas te falar que não para por aí, tá? Tudo isso vai te ajudar a ingressar na área oficialmente, mas SRE é tão generalista que muita gente se perde no meio do caminho. Eu hoje atuo com observabilidade, mas nada me impede de me especializar em redes e migrar de área, ou dados, ou até mesmo segurança. Já ouviu falar de DevSecOps? Haha, tem 'Ops' de tudo hoje em dia," disse Lauren, dando risada. "Mas, ô, tira uma foto comigo? Vou mandar pra Sofia, ela vai dar risada," perguntou ela.
- "Haha, vamo, tira aí. Rosana nem vai acreditar," respondeu Raul.

Fontes
O que é "A Odisséia de Observabilidade de Sofia"?
Adso Castro escreve sobre Observabilidade e SRE contando histórias pessoais e não tão pessoais assim, utilizando personagens fictícios na trama. A ideia é abordar assuntos complexos do mundo de Cloud Native de uma forma mais amigável. As histórias giram em torno das personagens Sofia e sua amiga e colega de equipe, Lauren.

