A profissão de cientista de dados, embora recente, está ganhando cada vez mais relevância e demanda no mercado de TI (Tecnologia da Informação), especialmente em empresas que estão usando Big Data para melhorar a gestão do negócio.
A ciência de dados é um estudo interdisciplinar que aplica computação, estatística, matemática e conhecimento de negócios para gerar bons resultados para as empresas. Sua grande importância está na capacidade de extrair informações relevantes — manipulando grandes volumes de dados —, que gerem conhecimento ou proporcionem insights para facilitar a tomada de decisões.
Quer conhecer o perfil do cientista de dados e que exigências profissionais são demandadas dele? Então continue a leitura deste post!
Quais são as principais atribuições do cientista de dados?
O cientista de dados tem por missão gerenciar o Big Data, de modo a constituir uma base de dados limpa, sem redundâncias e relevante. A partir daí é possível realizar análises preditivas que permitam identificar informações de alta qualidade, resultantes da combinação de dados de diversas fontes dispersas entre si — sistemas informatizados locais, e-commerce, redes sociais, plataformas de serviços, aplicativos, e-mails, sensores etc.
À medida que avança em suas descobertas, o cientista de dados automatiza processos de Machine Learning, gera inteligência de mercado, cria produtos de dados e apresenta solução para problemas corporativos. Esse profissional lança mão de aprendizagem de máquina, estatística, matemática e gestão de negócios para alcançar os resultados pretendidos pela organização que demandou seus serviços.
Quais são as principais áreas de atuação desse profissional?
As principais áreas que demandam os serviços profissionais do cientista de dados são:
- Business Intelligence — entregar a informação certa para a pessoa certa em tempo real;
- ciência da decisão — dar suporte informacional para a tomada de decisão;
- Machine learning — aprimorar continuamente modelos de ciências de dados.
Como se tornar um cientista de dados?
Para se capacitar para essa profissão promissora, alguns cursos são básicos. Confira-os a seguir.
Fundamentos de Data Science I
Esse curso dura 2 meses e proporciona aprendizado em lógica de programação, estruturas condicionais e linguagem Python, somado à manipulação de bibliotecas — tais como Panda e NumPy. O profissional também adquire conhecimento sobre como tratar dados para visualizar oportunidades de negócios.
Fundamentos de Data Science II
Nesse novo nível, que tem duração de 4 meses, o profissional terá contato com Machine Learning (conhecimento fundamental para atuar nessa área), SQL (linguagem de consulta estruturada, apropriada para a análise de banco de dados relacional) e a metodologia denominada data wrangling, que permite combinar dados de fontes diversas e fazer estatísticas para levantar, testar e validar hipóteses.
Cientista de Dados
Essa etapa de aprendizado requer 6 meses de dedicação. Nela, o profissional vai descobrir como fundamentar o processo decisório de um negócio em dados confiáveis e informações de qualidade — já que intuição e/ou experiência não são suficientes para gerar bons resultados.
O cientista de dados vai aprender a linguagem de programação R — apropriada para manipulação, análise e visualização gráfica de dados —, assim como conceitos de Big Data, aprendizagem com ou sem supervisão, MapReduce e engenharia de software. Além disso, há aulas práticas para acumular vivência dos processos de ciência de dados.
Para ser um profissional completo, também é possível realizar cursos específicos para se tornar um analista de dados — 8 meses de preparação — ou mesmo um engenheiro de Machine Learning — 14 meses de estudos.
Algumas universidades brasileiras já oferecem cursos regulares de graduação ou pós-graduação em ciência de dados.
Quais são as principais habilidades exigidas?
Entre as habilidades técnicas e pessoais exigidas para o exercício da função de cientista de dados, podemos destacar as seguintes.
Sólido conhecimento de programação
É necessário conhecer linguagens de programação atualizadas — tais como Python, Java etc. —, que são adequadas para o ambiente de dados que será manipulado.
Conhecimento de negócios
Saber usar a ciência de dados para apoiar as estratégias de negócios, produzir ideias disruptivas e alavancar a lucratividade das empresas é essencial.
Pensamento crítico
O profissional deve ter um pensamento que alia curiosidade, criação e teste de hipóteses, simulação de cenários e outros pontos para separar dados relevantes no emaranhado de fontes com os quais trabalha.
Capacidade de aprendizado rápido
As tendências de mercado evoluem rapidamente, fazendo com que esse profissional precise estar constantemente atualizado.
Grande facilidade de comunicação
O trabalho realizado deve resultar em comunicação clara — tanto escrita quanto falada —, que permita suporte para a tomada de decisões, a evolução contínua do aprendizado de máquina e para gerar alta disponibilidade de informações.
O cientista de dados transita entre a tecnologia da informação e a gestão empresarial. Em cada um desses ambientes as linguagens de comunicação são bastante distintas, muito embora interajam frequentemente. Por isso, esse profissional precisa saber transmitir mensagens que sejam facilmente entendidas — ser um bom comunicador.
Raciocínio lógico e numérico aguçado
É preciso saber aplicar a lógica para extrair informações de qualidade e desenvolver soluções, bem como ter habilidades matemáticas para decifrar algoritmos aplicados na internet e para produzir estatísticas que facilitem o entendimento de situações e tendências.
Proatividade
Outra característica é ter iniciativa para superar obstáculos, realizar pesquisas, buscar informações, firmar parcerias e o que for preciso para assegurar o sucesso dos projetos em que está envolvido.
Ética e bom senso
Realizar sua função sem tendenciosidades ou vieses — com isenção e imparcialidade — é a base da qualidade pessoal desse profissional.
Qual é o contexto da profissão?
As habilidades pessoais e as capacitações técnicas poderão variar em função da especialização do cientista de dados, da área de atuação da empresa para a qual ele trabalha e dos projetos de Data Science e Big Data que serão desenvolvidos.
Na verdade, é muito raro que um profissional reúna todas as capacitações técnicas e habilidades propagadas como sendo necessárias para o cientista de dados. Sendo assim, é muito mais fácil formar uma equipe de cientistas de dados com competências complementares do que ter um único profissional dedicado a essa ciência.
A perspectiva de futuro é que essa seja a profissão mais demandada na área de tecnologia da informação nos próximos 2 anos — segundo a empresa de recrutamento Michael Page.
Como vimos, com o crescimento do volume, da diversidade e da velocidade de geração de dados, a profissão de cientista de dados está crescendo em demanda e importância. Esse profissional pode contribuir decisivamente para garantir o sucesso das empresas em seus projetos de Data Science e Big Data, principalmente para gerar novas oportunidades de negócios.
Quer esclarecer alguma dúvida, compartilhar informações ou saber mais sobre o assunto? Deixe um comentário neste post!