Crédito CC0:domínio público
As pessoas que procuram um apartamento nas grandes cidades costumam usar a presença de restaurantes para determinar se um bairro seria um bom lugar para se viver. Acontece que há muito nessa regra:estudiosos de estudos urbanos do MIT descobriram que, na China, os dados do restaurante podem ser usados para prever os principais atributos socioeconômicos dos bairros.
De fato, usando dados de restaurantes online, os pesquisadores dizem, eles podem prever efetivamente a população diurna de um bairro, população noturna, o número de empresas localizadas nele, e o valor dos gastos gerais na vizinhança.
“A indústria da restauração é uma das indústrias de consumo local mais descentralizadas e desregulamentadas, "diz Siqi Zheng, um professor de estudos urbanos no MIT e co-autor de um novo artigo descrevendo as descobertas. “É altamente correlacionado com os atributos socioeconômicos locais, como população, fortuna, e consumo. "
Usar dados de restaurantes como proxy para outros indicadores econômicos pode ter um propósito prático para planejadores urbanos e formuladores de políticas, dizem os pesquisadores. Na China, como em muitos lugares, um censo é feito apenas uma vez por década, e pode ser difícil analisar a dinâmica das áreas em constante mudança de uma cidade em um ritmo mais rápido. Assim, novos métodos de quantificação dos níveis residenciais e da atividade econômica podem ajudar a orientar as autoridades municipais.
"Mesmo sem os dados do censo, podemos prever uma variedade de atributos de um bairro, o que é muito valioso, "acrescenta Zheng, quem é Samuel Tak Lee Professor Associado de Desenvolvimento Imobiliário e Empreendedorismo, e diretor do corpo docente do MIT China Future City Lab.
"Hoje existe uma divisão de big data, "diz Carlo Ratti, diretor do Senseable City Lab do MIT, e coautor do artigo. "Os dados são cruciais para entender melhor as cidades, mas em muitos lugares não temos muitos dados [oficiais]. Ao mesmo tempo, temos cada vez mais dados gerados por aplicativos e sites. Se usarmos esse método, [podemos] entender os dados socioeconômicos em cidades onde eles não coletam dados. "
O papel, "Prevendo os atributos socioeconômicos dos bairros usando dados de restaurantes, "aparece no Proceedings of the National Academy of Sciences . Os autores são Zheng, quem é o autor correspondente; Ratti; e Lei Dong, um pós-doutorado co-organizado pelo MIT China Future City Lab e o Senseable City Lab.
O estudo examina de perto nove cidades na China:Baoding, Pequim, Chengdu, Hengyang, Kunming, Shenyang, Shenzen, Yueyang, e Zhengzhou. Para conduzir o estudo, os pesquisadores extraíram dados de restaurantes do site Dianping, que eles descrevem como o equivalente chinês do Yelp, o site de avaliação de negócios em inglês.
Ao combinar os dados Dianping com dados confiáveis, dados existentes para essas cidades, incluindo dados anônimos e agregados de localização de telefones celulares de 56,3 milhões de pessoas, registros de cartão bancário, registros de registro da empresa, e alguns dados do censo - os pesquisadores descobriram que podiam prever 95% da variação da população diurna entre os bairros. Eles também previram 95 por cento da variação na população noturna, 93 por cento da variação no número de empresas, e 90 por cento da variação nos níveis de consumo do consumidor.
"Usamos novos dados disponíveis publicamente e desenvolvemos novos métodos de aumento de dados para tratar dessas questões urbanas, "diz Dong, que acrescenta que o modelo do estudo é uma "nova contribuição para [o uso de] ciência de dados para o bem social, e big data para comunidades de economia urbana. "
Os pesquisadores observam que este é um proxy mais preciso para estimar a atividade demográfica e econômica no nível do bairro do que outros métodos usados anteriormente. Por exemplo, outros pesquisadores usaram imagens de satélite para calcular a quantidade de luz noturna nas cidades, e, por sua vez, usou a quantidade de luz para estimar a atividade no nível da vizinhança. Embora esse método funcione bem para estimativas populacionais, o método de dados do restaurante é melhor no geral, e muito melhor em estimar a atividade empresarial e os gastos do consumidor.
Zheng diz que se sente "confiante" de que o modelo dos pesquisadores pode ser aplicado a outras cidades chinesas porque já mostra um bom poder preditivo entre as cidades. Mas os pesquisadores também acreditam que o método que empregaram - que usa técnicas de aprendizado de máquina para se concentrar em correlações significativas - poderia ser aplicado a cidades ao redor do globo.
"Esses resultados indicam que os dados do restaurante podem capturar indicadores comuns de resultados socioeconômicos, e essas semelhanças podem ser transferidas ... com precisão razoável em cidades onde os resultados da pesquisa não são observados, "afirmam os pesquisadores no jornal.
Como os estudiosos reconhecem, seu estudo observou correlações entre os dados do restaurante e as características do bairro, em vez de especificar os mecanismos causais exatos em ação. Ratti observa que o vínculo causal entre restaurantes e características do bairro pode funcionar nos dois sentidos:às vezes, os restaurantes podem atender à demanda em uma área já próspera, enquanto em outras ocasiões sua presença é um prenúncio de um desenvolvimento futuro.
"Há sempre um empurrão e um puxão" entre os restaurantes e o desenvolvimento do bairro, Ratti diz. "Mas mostramos que os dados socioeconômicos estão muito bem refletidos na paisagem dos restaurantes, nas cidades que olhamos. A descoberta interessante é que isso parece ser muito bom como proxy. "
Zheng diz que espera que outros estudiosos aprendam o método, que, em princípio, poderia ser aplicado a muitos tópicos de estudos urbanos.
"Os próprios dados do restaurante, bem como a variedade de atributos de vizinhança que prevê, pode ajudar outros pesquisadores a estudar todos os tipos de questões urbanas, o que é muito valioso, "Zheng diz.