######################################################## # baixar dados de fecund. para munic. bras. em 2010 # visualizar a distrib. de taxas de fecund. para # mulheres de 20-24 anos, em munic. com amostras # censitárias de n > 200 mulheres nessa faixa etária ######################################################## graphics.off() # desliga o painel gráfico windows(record=TRUE) # abre uma nova janela, fora do R studio, para os gráficos # local dos dados na internet url = 'http://ufrn.schmert.net/dados/fecund.2010.csv' # baixando os dados para um data.frame D = read.csv( url) # baixar o pacote dplyr (é necessario fazer isso só uma vez) # install.packages('dplyr') # use o pacote library('dplyr') # vetor de variáveis lógicas para (n > 200) grande = (D$Mu20 > 200) # quantos municípios são grandes, por região table(D$Região, grande) # calcular a estimativa nascimentos no último ano / mulher # para todos os munic. do Brasil tx20 = D$Cr20 / D$Mu20 # distribuicao de estimativas para os *grandes* municipios plot( density( tx20[grande]), lwd=3, col='red') text( .11, 12, 'Grandes', col='red') # acrescenta ao plot a distibuicão para todos os municípios # nota: para acrescentar, usa-se o comando 'lines' lines( density( tx20), lwd=1, col='black') ## plot( density( log(tx20[grande])), lwd=6, col='red') m = mean(log(tx20[grande])) s = sd(log(tx20[grande])) m s val = seq(-3.5,-1.5, 0.1) lines( val, dnorm(val, m, s), col='blue', lwd=3) # conclusão: uma distrib. a priori log (theta) ~ Normal(-2.4 , .32) seria # razoavel para theta = 5f20 num pequeno munic.