Então você quer ser Cientista de Dados?

Gustavo Bruschi
10 min readJan 6, 2022

--

Fonte: https://bdasolutions.com.br/wp-content/uploads/2020/01/shutterstock_610018373.jpg

Costumo receber muitas dúvidas de iniciantes através das redes sociais. Com o tempo notei que boa parte dessas dúvidas se repetem, sendo maior parte sobre início ou mudança de carreira. Então listei 10 dúvidas mais comuns para quem está aprendendo ou em início de carreira. E ao final do texto, elenquei dúvidas que não vejo a galera perguntar, são dúvidas raras dos iniciantes, mas julgo importantes para se diferenciar no início da carreira.

Já adianto que não sou nenhum coach ou guru de carreira, e nem um dos melhores cientistas do mercado. Sou simplesmente um cara com alguns anos de carreira, que também já teve suas dúvidas lá atrás e aproveitou dicas dos profissionais mais experientes para crescer. Tenha brio e procure dicas de outras profissionais, lembre-se que “pessoas inteligentes aprendem com os próprios erros, e pessoas sábias aprendem com os erros dos outros”

Disclaimer:

Sem mais delongas, vamos lá !

Para começar, a motivação de ter feito esse post é simples: o número de pessoas querendo entrar na área só aumenta e muitas delas NÃO estão preparadas para os desafios das vagas.

1) Precisa de Faculdade?

Não. Você não precisa de formação acadêmica para entrar para o mercado de trabalho como Cientista de Dados. Mas claro, não vou negar que certos conhecimentos em exatas são adquiridos de maneira mais fácil na faculdade, como cálculo e estatística. E também existem certas vagas que cobram alguma formação específica, devido ao problema que visam solucionar, mas são bem menos comuns.

E caso cogite uma especialização como pós ou MBA, saiba que o mercado se importa cada vez menos por títulos e certificações. Um pedaço de papel é um bom signalling, mas não garante um emprego. É sobre quem sabe fazer, quem mete a mão na massa. E sinceramente, vejo muitos desses cursos preparando a galera muito mal, segue um relato: https://www.instagram.com/p/CWs3WTtgiCr/

Em áreas de tecnologias como Ciência de Dados, a universidade não é o conhecimento per si, mas um dos caminhos para ele. Isso pode aparecer como um alívio para muitos mas é na verdade uma grande responsabilidade: a não necessidade de uma universidade significa que o iniciante deve buscar sozinho este conhecimento. Ser autodidata é essencial nessa carreira, aconselho a organizar um roteiro de estudos ou pedir mentoria.

2) Preciso saber inglês?

Não, você não precisa saber inglês para iniciar em Cientista de Dados. Porém busque aprendê-lo, pois tornará sua vida mais fácil. Pelos seguintes motivos:

  1. Autonomia/Atualização: Boa parte dos conteúdos são lançados em inglês, e apenas muito tempo depois saem traduções. Como você está iniciando não precisa se preocupar com isso agora, mas se visa atingir um alto desempenho, manter-se atualizado em primeira mão será importante. Melhorar no inglês te permite acessar novas mídias, como: vídeos de diferentes fontes, eventos online, pdfs, whitepapers, pesquisas, etc;
  2. Carreira Internacional: Mercados internacionais estão contratando cada vez mais. Boa parte das empresas estão se globalizando através do trabalho remoto. Saber inglês te abrirá a possibilidade de trabalhar em muitos lugares do mundo (remoto ou não), aumentando seus ganhos e trazer novas experiências culturais;

3) Quais cursos devo fazer? Dicas?

Não sei te dizer. Muitos iniciantes perguntam para os mais experientes quais cursos fazer, onde aprender a programação, Machine Learning, etc e etc. E também de que forma aprender. Acontece que esses Cientistas de Dados já são experientes, eles já se distanciaram desse início. As referências podem ser outras, e com o tempo tecnologias morrem e nascem, assim é complicado dizer onde aprender o básico.

Porém, na minha opinião, alguns conhecimentos são essenciais para se conseguir uma primeira vaga: SQL, Python, Machine Learning e fazer projetos na prática. Eu particularmente gosto dessa lista de recomendação do Estatsite: https://estatsite.com.br/2021/11/22/ciencia-de-dados-em-portugues-por-menos-de-30-reais/

4) Qual a primeira linguagem devo aprender?

Aqui entra uma grande polêmica. Mas como falei no tópico anterior, acredito que SQL e Python são essenciais no contexto atual do mercado, são as linguagens líderes, e dominá-las vai te ajudar muito no começo da carreira.

Em seguida, acho legal conhecer outras linguagens como R e Julia, e até mesmo linguagens para processamento massivo de dados, como o Scala do Spark (que digasse de passagem, pode ser utilizado por um client do Python, o Pyspark). Porém, isso seria de forma secundária, como um plus em seu currículo.

5) Vou começar ganhando 10 mil?

Não. Se você está começando a aprender agora e deseja ingressar no mercado o quanto antes, as chances são mínimas de começar ganhando 10 mil. Existem alguns caminhos, empresas que podem pagar esse valor para iniciantes são raras, e tendo um bom inglês é possível partir como Júnior para o mercado internacional.

Mas via de regra, não é o que acontecerá. Você terá bons salários, boa perspectiva e rápida evolução salarial com o tempo, isso de fato é verdade, mas não existe milagre de estudar 4 meses e ganhar 10 mil, isso é lorota, não se iluda.

6) Vou demorar pra conseguir emprego?

Depende. Essa é uma pergunta complicada pois a maioria das pessoas leva um tempo até entrar em alguma vaga, são muitos nãos em entrevistas e feedbacks negativos até vocês estar “cascudo” o suficiente para conseguir emprego.

Mas por outro lado, já vi uma parcela considerável de pessoas entrar rápido no mercado. Eu vejo que esse grupo possuí alguns diferencias, em especial saber demonstrar que resolve problemas, demonstrando isso através da resolução de cases, ótima comunicação, e com um bom portfólio, e até networking.

7) Vou ter que estudar durante toda a vida?

Sim, você vai. Seja através de cursos, vídeos e aprendendo coisas novas enquanto resolve problemas. Acostume-se a aprender. É preciso aprender à aprender, ou seja, aprender as melhores maneiras de aprender. Descobrir quais métodos de aprendizagem funcionam melhor com você.

Vale ressaltar que isso não é ruim. Nós carregamos uma falsa crença de que o processo de aprender é massante e entediante, como é o caso do ensino escolar, mas em dados isso é muito mais legal, uma vez que você ganha a capacidade de resolver novos problemas.

8) Não preencho todos os requisitos nunca, sou um iniciante ruim?

Não, até porque você é um iniciante. Com os avanços da área, os requisitos crescem cada vez mais,. Será difícil ver uma vaga de emprego a qual você preencherá TODOS os requisitos.

Minha dica é: Seja cara de pau e candidate-se, caso preencha a maioria dos requisitos chave de uma vaga (digamos, 3/4 dos requisitos). Seja honesto/a na entrevista, e bola pra frente.

9) Preciso ser bom em matemática?

Sim. E nem entrarei em detalhes, então aprenda. Se você não sabe matemática, você é forçado a apenas copiar as soluções de outras pessoas o tempo todo e você se limita em termos dos problemas que você é capaz de resolver.

Fonte: https://www.instagram.com/p/CYXqmekAXQG/

É completamente possível aprender a matemática da graduação online. Você pode encontrar cursos gratuítos e em português em sites como o Khan Academy.

10) Tenho mais que 30 anos, estou velho pra começar agora?

Não. Um dos motivos que gosto na área de Ciência de Dados (e Tecnologia como um todo) é como ela abre oportunidades para pessoas mais velhas.

Hoje vejo pessoas de 40, 50 anos tão produtivas quanto os jovens, aliás, com várias qualidades como paciência, visão de riscos, maturidade, qualidade (gostam de revisar o que fazem para não ter erros), visão do todo, resiliência, humildade para entender que mesmo com sua vasta experiência ainda tem oportunidade de evolução. Recomendo uma matéria legal sobre isso: https://economia-estadao-com-br.cdn.ampproject.org/c/s/economia.estadao.com.br/noticias/sua-carreira,mercado-mira-talentos-50-para-reduzir-deficit-na-tecnologia,70003938189.amp

Dúvidas Extras

Aqui seguem algumas dicas extras que julgo relevantes para os novatos na área que querem deixar de ser medianos e evoluir consistentemente na carreira. São dúvidas que são raramente perguntadas, e você não precisa seguir todas essas dicas de cara (eu mesmo não segui todas), mas acredito que pelo menos uma ou duas acelerará sua entrada e desenvolvimento na carreira com o tempo.

PS: Não há uma ordem de importância abaixo, siga as dicas de acordo com o que achar melhor.

Construção de Portfólio/Currículo: Você não tem controle sobre o que o recrutador ou gestor da área pensa, mas você tem total controle sobre tudo que vai ser destacado em seu currículo/portfólio, use isso de forma inteligente e a seu favor. Se você está iniciando na carreira, é você que tem o desafio de mostrar que está preparado para a vaga e convencer o recrutador disso e não o contrário.

Alguns pontos que podem fazer parte do seu currículo são dicas muito boas que roubei desse artigo do Gabriel Lages:

  • Carta de Apresentação: É importante mostrar porque você está entrando na área, seja via estágio ou uma migração. Se isso não estiver claro para o recrutador as chances de passar na entrevista são remotas. Foque mais em motivos sobre o seu futuro do que o seu passado;
  • Experiências Profissionais: Estude bem a vaga que você quer se candidatar, conheça as funções do cargo, a área e a empresa. E após isso, tente voltar a cada ponto da sua experiência profissional e relacionar como seus aprendizados podem te ajudar em desafios de Ciência de Dados;
  • Portfólio: Esse pode elemento responsável por quebrar a objeção do recrutador ao pensar que você não tem nenhuma experiência prática. O portfólio pode ser uma página no Github, um blog, ou até mesmo um documento;
  • Competências Técnicas: Procure dar destaque a competências técnicas que estejam relacionadas a vaga, fuja de competências muito óbvias (Excel e Word). Outro ponto interessante é que talvez você não saiba Python mas já tenha desenvolvido em outras linguagens, talvez não saiba Power BI mas saiba fazer cruzamentos e dashboards em Tableau ou Qlik. Se você conseguir deixar claro no currículo que tem ciência disso e está em processo de aprendizado desses novos conhecimentos, isso pode ser visto como um ponto muito positivo.

Além desses pontos, você pode comprovar experiência prática na área participando de competições e hackatons.

Networking: A área de Ciência de Dados, assim como tecnologia em geral, se beneficia do networking gerado através de comunidades. As comunidades mostram as principais tendências do mercado, ajudam a entender as soluções e ferramentas mais utilizadas, tiram dúvidas e também ajudam com indicações para vagas. E ao mesmo tempo que você absorve o conhecimento dos outros, você também pode contribuir de volta.

Compreenda a “Esteira de Dados”: Um diferencial é aprender atividades além da modelagem/Ciência de Dados, como Engenharia de Dados e Engenharia de ML/MLOps, e até mesmo as regras de negócio/produto.

Além disso, entenda como o dado que você trabalha é ingerido e transformado, e como você disponibilizará suas entregas. Tenha noção de como realizar um ETL, construir features para um modelo, entregar seu modelo numa API ou até mesmo containerizar uma mini aplicação.

Fonte: https://developer.ibm.com/articles/ba-intro-data-science-1/

Não peço que você seja um especialista nas coisas que mencionei, o Cientista Full Stack/Unicórnio é uma lenda, mas saiba como o trabalho de um Cientista de Dados impacta a cadeia como um todo.

Isso vai melhorar muito a qualidade das suas entregas e você será mais independente.

Observação: o Andrew Ng, que tem o curso mais famoso de Machine Learning, viu essa demanda no mercado, e lançou um curso de MLOps: https://pt.coursera.org/specializations/machine-learning-engineering-for-production-mlops

Versionamento: Quando digo “versionamento”, estou me referindo especificamente ao GitHub e Git. Git é o principal sistema de controle de versão usado no mundo, e GitHub é essencialmente um repositório baseado em nuvem para arquivos e pastas.

Estas tecnologias permitem que você colabore e trabalhe em projetos em paralelo com outros. E mantém o controle de todas as versões do seu código (no caso de você precisar reverter para versões mais antigas).

Linux: O Linux tem uma participação de mercado relavante em servidores de aplicação. Dito isso, se você estiver configurando um servidor, é muito provável que ele execute o Linux.

Freqüentemente, os Cientistas de Dados precisam implantar um modelo, e existem muitas ferramentas interessantes que podem ser acessadas na linha de comando do Linux para automatizar essas tarefas, algo que qualquer profissional da área deveria se interessar.

Cloud: Hoje em dia, muitas empresas estão migrando seus ambientes de desenvolvimento e produção para a Nuvem. Uma das principais motivações é que ela evita muitas das problemáticas associadas à configuração e gerenciamento do hardware e software. Isso é feito através do aluguel de recursos disponibilizados algum provedor de nuvem, como AWS, Azure e GCP.

Usar esse tipo de abordagem, portanto, possibilita que os Cientistas de Dados se concentrem apenas no desenvolvimento e implantação de seus serviços (por exemplo, site, banco de dados, aplicativos, análise de dados) sem ter que pensar em qualquer sobrecarga possível. Portanto, aprenda os fundamentos de computação em nuvem e seja menos dependente dos times de arquitetura para realizar seus trabalhos.

Negócios/Produtos: Os Cientistas de Dados devem se orientar para a estratégia de negócios, e ter capacidade de entender os problemas e solucioná-los através de um ponto de vista analítico e baseado em dados. Este skill é algo que será refinado com o tempo, conforme desenvolve seu portfólio e avança no trabalho.

Um adendo aqui é que 90% dos projetos em Machine Learning falham, então saber sobre negócios te coloca nos 10% restantes, e eu vou explicar porque. Seu projeto de Ciência de Dados deve gerar valor para o negócio, e isso envolve definir o custo x retorno de tudo o que você está fazendo. Seja aumentar conversão de usuários, diminuir o churn, cortar custos operacionais, etc.

E além disso você deve engajar líderes de negócio/produto, pois são eles quem tomam as rédeas sobre o rumo da empresa.

Conclusão

Espero que essas respostas possam ajudá-los. Boa sorte em seus estudos e aplicações para vagas.

Notas:

Quaisquer erros são de minha autoria. O texto contém minhas opiniões bem pessoais e viesadas, procurem outros profissionais e escutem a opinião deles. Fiquem à vontade para dar feedbacks e críticas construtivas.

Agradeço o André Yukio, do Estatsite e do Universidade dos Dados, pelos feedbacks e ajuda com o texto.

--

--