• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • A ciência de dados é um campo em crescimento. Veja aqui como treinar pessoas para fazer isso

    Ter os dados ao seu alcance não é suficiente - os cientistas de dados devem saber como aplicá-los. Crédito:Gorodenkoff / Shutterstock

    O mundo está inundado de dados. Há um tsunami virtual de dados se movendo ao redor do globo, renovando-se diariamente. Considere apenas os mercados financeiros globais. Eles geram grandes quantidades de dados - preços de ações, preços de commodities, índices, preços de opções e futuros, para citar apenas alguns.

    Mas os dados são inúteis se não houver pessoas capazes de coletar, agrupar, analisá-lo e aplicá-lo em benefício da sociedade. Todos os dados gerados pelos mercados financeiros globais são usados ​​para a gestão de ativos e fortunas - e devem ser analisados ​​e entendidos adequadamente para informar uma boa tomada de decisão. É aí que entra a ciência de dados.

    O objetivo principal da ciência de dados é extrair insights de dados em várias formas, estruturados e não estruturados. É um campo multidisciplinar, envolvendo tudo, desde matemática aplicada a estatística e inteligência artificial ao aprendizado de máquina. E está crescendo. Isso se deve aos avanços na tecnologia da computação e na velocidade de processamento, o custo relativamente baixo para armazenar dados, e a disponibilidade massiva de dados da Internet e outras fontes, como os mercados financeiros globais.

    Para que a ciência de dados aconteça, claro, você precisa de cientistas de dados. Como a ciência de dados tem um escopo tão amplo, ser cientista de dados abrange uma variedade de profissões. Isso inclui estatísticos, pesquisadores de operações, engenheiros, Cientistas da computação, atuários, físicos e aprendizes de máquina.

    Essa variedade não é necessariamente uma coisa ruim. De minha própria experiência prática, Aprendi rapidamente que, ao resolver problemas de ciência de dados, você precisa de uma variedade de pessoas. Alguns podem trabalhar em profundidade na teoria e outros podem explorar a área de aplicação.

    Mas como esses cientistas de dados devem ser treinados para que estejam preparados para os desafios de big data que estão por vir?

    Os cientistas de dados normalmente usam técnicas matemáticas inovadoras de seus próprios subcampos para tentar resolver problemas em uma área de aplicação específica. As áreas de aplicação - finanças, saúde, agricultura e astronomia são apenas alguns exemplos - são muito diferentes. Isso significa que cada um apresenta problemas diferentes, e, portanto, os cientistas de dados precisam de conhecimento sobre a área de aplicação específica.

    Por exemplo, considere a astrofísica e a Matriz do Quilômetro Quadrado sendo construída no extremo sul da África. Será o maior radiotelescópio do mundo quando concluído em meados da década de 2020. Diz-se que o conjunto de telescópios recebe dados a um terabyte por segundo e os pesquisadores normalmente estão interessados ​​em analisar as massas de dados para detectar sinais minúsculos envolvidos no ruído branco.

    Em finanças, os pesquisadores exploram grandes bancos de dados de maneira muito diferente:por exemplo, para aprender mais sobre o comportamento de crédito de seus clientes.

    Os subcampos mais estabelecidos da ciência de dados são estatísticas e pesquisa operacional e pode valer a pena aprender com os programas de treinamento estabelecidos nesses campos. As universidades estão treinando graduados suficientes nessas áreas? E esse treinamento é bom o suficiente?

    Embora os alunos nessas áreas sejam bem treinados academicamente, muitos graduados em estatística e pesquisa operacional carecem de conhecimento sobre as áreas em que se espera que apliquem as técnicas matemáticas. Eles também tendem a lutar contra as habilidades de resolução de problemas do mundo real, bem como falta de programação numérica e habilidades de manuseio de dados. Isso ocorre porque essas habilidades não são abordadas de forma adequada em muitos currículos.

    Então, aproveitando essas falhas e as lições dos subcampos de ciência de dados estabelecidos, o que as universidades devem ensinar aos aspirantes a cientistas de dados? Aqui está minha lista.

    • Ciências matemáticas e computacionais, incluindo cursos de estatística e teoria da probabilidade, inteligência artificial, aprendizado de máquina, pesquisa operacional, e ciência da computação.
    • Habilidades de programação;
    • Habilidades de gerenciamento de dados;
    • Conhecimento do assunto em campos selecionados de aplicação; e
    • Habilidades profissionais de resolução de problemas.

    Essa lista pode ser expandida no nível de pós-graduação. E, seja em nível de graduação ou pós-graduação, todos esses cursos devem ter um elemento prático. Isso permite que os alunos desenvolvam profissionalismo e habilidades de resolução de problemas.

    Por exemplo, no Centro de Matemática e Informática para Negócios da North-West University da África do Sul, meus colegas e eu organizamos um programa de treinamento profissional no qual os alunos trabalham por seis meses em uma empresa cliente para resolver um problema específico do setor. Esses problemas são principalmente no campo financeiro; por exemplo, modelos para prever a capacidade e a disposição de pagar de um cliente, modelos de melhoria de cobrança e modelos de identificação de fraudes.

    Isso ajuda os alunos a desenvolver as habilidades necessárias para atuar no mundo do trabalho, lidar com dados reais e aplicá-los a problemas reais, em vez de apenas trabalhar em um nível teórico. Isso também, como um colega e eu argumentamos em pesquisas anteriores, ajuda a fechar a lacuna entre a academia e a indústria e, assim, torna a ciência de dados mais relevante. Os programas da BMI foram reconhecidos e recomendados por especialistas internacionais.

    Ciência de dados, como um campo, só vai crescer nas próximas décadas. É imperativo que as universidades treinem graduados que possam lidar com enormes trechos de dados, trabalhe em estreita colaboração com as indústrias que produzem e aplicam esses dados - e faça dos dados algo que pode mudar o mundo para melhor.

    Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.




    © Ciência https://pt.scienceaq.com