Compartilhar

Desenho da amostra do Estudo do Risco Cardiovascular em Adolescentes (ERICA)

Desenho da amostra do Estudo do Risco Cardiovascular em Adolescentes (ERICA)

Autores:

Mauricio Teixeira Leite de Vasconcellos,
Pedro Luis do Nascimento Silva,
Moyses Szklo,
Maria Cristina Caetano Kuschnir,
Carlos Henrique Klein,
Gabriela de Azevedo Abreu,
Laura Augusta Barufaldi,
Katia Vergetti Bloch

ARTIGO ORIGINAL

Cadernos de Saúde Pública

versão impressa ISSN 0102-311Xversão On-line ISSN 1678-4464

Cad. Saúde Pública vol.31 no.5 Rio de Janeiro maio 2015

http://dx.doi.org/10.1590/0102-311X00043214

Introdução

O Estudo de Riscos Cardiovasculares em Adolescentes (ERICA) pretendia fornecer estimativas nacionais da prevalência de fatores de risco cardiovascular e da síndrome metabólica por sexo e idade em adolescentes (12 a 17 anos).

Para tal fim, seria necessário basear o estudo em uma amostra domiciliar de nível nacional, que coletasse informações no subconjunto de domicílios com adolescentes. Entretanto, considerando o custo proibitivo de uma pesquisa domiciliar em nível nacional, optou-se por uma pesquisa através de escolas e por limitar a população de pesquisa aos adolescentes matriculados nos três últimos anos do Ensino Fundamental e nos três anos do Ensino Médio de escolas (públicas ou privadas) localizadas em municípios com mais de 100 mil habitantes, agrupados em 32 estratos geográficos descritos neste artigo. Um estudo baseado em amostra de alunos estratificada geograficamente e conglomerada por escolas, turnos e anos, e turmas, além de permitir inferência para o conjunto dos municípios mais populosos do Brasil e para estratos geográficos que permitem visualizar as diferenças regionais do Brasil, foi a solução para adequar os custos estimados do ERICA ao orçamento disponível. Assim optou-se por uma amostra selecionada em três estágios: escolas; combinações de turno e ano; e turmas. Nas turmas selecionadas todos os alunos elegíveis foram convidados a participar da pesquisa.

Este artigo descreve a população do estudo e sua estratificação geográfica; o cálculo do tamanho de amostra e sua alocação entre os estratos; os métodos para seleção das escolas, combinações de turno e ano, e turmas; o tratamento da não resposta entre adolescentes; o cálculo e calibração dos pesos amostrais; e as técnicas recomendadas para análise dos dados coletados.

População de pesquisa

A população de pesquisa 1 corresponde ao conjunto de adolescentes de 12 a 17 anos, que não possuem qualquer deficiência provisória ou definitiva, e que cursam um dos três últimos anos do Ensino Fundamental ou dos três anos do Ensino Médio nos turnos da manhã ou da tarde, em escolas públicas ou privadas localizadas em um dos 273 municípios com mais de 100 mil habitantes em 1o de julho de 2009 (dado populacional mais recente à época das definições básicas do ERICA).

A caracterização da população de pesquisa é feita com base em arquivo fornecido pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP/MEC), que foi produzido com dados do Censo Escolar 2011, cujos microdados são disponíveis em ftp://ftp.inep.gov.br/microdados/micro_censo_escolar_2011.zip (acessado em 16/Fev/2012), visto ter sido o usado na seleção das combinações de turno e ano em cada escola selecionada.

Considerando alunos sem defasagem escolar, espera-se que adolescentes de 12 a 17 anos estejam matriculados em turmas de um dos três últimos anos do Ensino Fundamental (7o ao 9o ano) ou de um dos três anos do Ensino Médio, que foram então definidos como os anos elegíveis. Assim, do total de 237.438 escolas investigadas pelo Censo Escolar 2011, existiam 389.315 combinações de turnos e anos elegíveis.

No entanto, 63.912 dessas combinações referiam-se a turmas de correção de fluxo (8.114), Fundamental não seriado ou multi-seriado (54.973) e Médio não seriado (825) que foram desconsideradas por não terem uma associação explícita com o ano ou série e, portanto, com a idade do aluno. Além disso, existiam 51.953 combinações relativas a turno noturno, que também foram desconsideradas por razões operacionais: 10.559 no Ensino Fundamental; e 41.394 no Ensino Médio. Assim, em todo o país ficaram 273.450 combinações elegíveis de turno e ano, em 61.325 escolas.

Ao considerar apenas as escolas localizadas nos 273 municípios com mais de 100 mil habitantes em 1o de julho de 2009, o número dessas combinações caiu para 117.726 e o de escolas para 24.441.

A Tabela 1 indica o total de escolas, turmas e alunos dos turnos e anos elegíveis, observados pelo Censo Escolar 2011 no país e no conjunto dos 273 municípios considerados (os com população maior que 100 mil habitantes). Nela pode-se observar que o recorte geográfico feito no estudo significa que a população de pesquisa representa pouco mais de 54% (8,2 milhões) da população brasileira de adolescentes matriculados em escolas (15,3 milhões) nos turnos e anos elegíveis.

Tabela 1 Número de escolas, turmas e alunos por situação urbana e rural, segundo o nível geográfico e a dependência administrativa da escola. 

Nível geográfico e dependência administrativa Escolas Turmas Alunos
Total Urbana Rural Total Urbana Rural Total Urbana Rural
Total nacional 61.325 46.675 14.650 516.701 463.128 53.573 15.233.991 14.119.065 1.114.926
 Públicas 48.440 33.955 14.485 431.969 379.153 52.816 12.960.385 11.862.698 1.097.687
 Privadas 12.885 12.720 165 84.732 83.975 757 2.273.606 2.256.367 17.239
273 municípios 24.441 22.698 1.743 261.086 253.051 8.035 8.273.275 8.076.757 196.518
 Públicas 15.942 14.244 1.698 198.266 190.477 7.789 6.492.228 6.301.417 190.811
 Privadas 8.499 8.454 45 62.820 62.574 246 1.781.047 1.775.340 5.707

Estratificação da população de pesquisa

A população de pesquisa foi estratificada em 32 estratos geográficos assim constituídos: cada um dos 27 municípios de capital e cinco estratos com o conjunto de municípios de mais de 100 mil habitantes de cada uma das cinco macrorregiões do país.

A distribuição da população de pesquisa pelos estratos geográficos, sumarizada na Tabela 2, indica que 44% dos alunos da população de pesquisa estavam em escolas dos estratos de capital, enquanto os restantes 56% pertenciam a escolas dos demais estratos.

Tabela 2 Distribuição do número de escolas, turmas e alunos por situação urbana e rural, segundo o grupo de estratos geográficos e a dependência administrativa da escola. 

Grupo de estratos e dependência administrativa Escolas Turmas Alunos
Total Urbana Rural Total Urbana Rural Total Urbana Rural
Total (273 municípios) 24.441 22.698 1.743 261.086 253.051 8.035 8.273.275 8.076.757 196.518
 Públicas 15.942 14.244 1.698 198.266 190.477 7.789 6.492.228 6.301.417 190.811
 Privadas 8.499 8.454 45 62.820 62.574 246 1.781.047 1.775.340 5.707
Capitais (27 estratos) 9.771 9.520 251 111.591 110.292 1.299 3.616.486 3.583.046 33.440
 Públicas 5.656 5.416 240 78.814 77.566 1.248 2.668.859 2.636.762 32.097
 Privadas 4.115 4.104 11 32.777 32.726 51 947.627 946.284 1.343
Outros (5 estratos) 14.670 13.178 1.492 149.495 142.759 6.736 4.656.789 4.493.711 163.078
 Públicas 10.286 8.828 1.458 119.452 112.911 6.541 3.823.369 3.664.655 158.714
 Privadas 4.384 4.350 34 30.043 29.848 195 833.420 829.056 4.364

Tamanho da amostra

Considerando a prevalência da síndrome metabólica em adolescentes de 4%, a ser estimada com erro máximo de 0,9% e com nível de 95% de confiança, o tamanho requerido para uma amostra aleatória simples seria de 1.821 alunos. Considerando que a amostra é conglomerada por escola, turno e ano, e turma, foi calculado um efeito de desenho de 2,97 para a média de massa corporal, obtido a partir do processamento dos dados do inquérito de 2007 do sistema de vigilância para fatores de risco à saúde de adolescentes, implementado no Município do Rio de Janeiro, Brasil (detalhes em Castro et al. 2). Como o efeito do desenho muda segundo a variável considerada e é, portanto, uma precaução no cálculo do tamanho de amostras conglomeradas, decidiu-se usar esse valor, o que conduziria a um tamanho de amostra de 5.408 (≈ 1.821 x 2,97) alunos, que, acrescido de 15% para compensar perdas esperadas de não resposta e outras, alcançou o valor de 6.219 adolescentes. Como a pesquisa deve produzir estimativas com a precisão especificada para cada um de 12 domínios (= 6 idades x 2 sexos), isto conduziu a um tamanho total de amostra de 74.628 adolescentes, que, após sua alocação, foi arredondado para 75.060 adolescentes, pois tamanhos múltiplos de 60 eram necessários em cada estrato, como indicado na Tabela 3.

Tabela 3 Tamanho final da amostra de escolas, turmas e adolescentes, segundo o estrato geográfico da amostra. 

Estrato geográfico Tamanho final da amostra
Escolas Turmas Alunos
Total 1.251 3.753 75.060
Porto Velho 24 72 1.440
Rio Branco 24 72 1.440
Manaus 42 126 2.520
Boa Vista 22 66 1.320
Belém 36 108 2.160
Macapá 25 75 1.500
Palmas 20 60 1.200
Outros da Região Norte 45 135 2.700
São Luís 34 102 2.040
Teresina 33 99 1.980
Fortaleza 44 132 2.640
Natal 30 90 1.800
João Pessoa 29 87 1.740
Recife 39 117 2.340
Maceió 32 96 1.920
Aracaju 26 78 1.560
Salvador 44 132 2.640
Outros da Região Nordeste 68 204 4.080
Belo Horizonte 43 129 2.580
Vitória 22 66 1.320
Rio de Janeiro 56 168 3.360
São Paulo 71 213 4.260
Outros da Região Sudeste 103 309 6.180
Curitiba 39 117 2.340
Florianópolis 23 69 1.380
Porto Alegre 33 99 1.980
Outros da Região Sul 66 198 3.960
Campo Grande 29 87 1.740
Cuiabá 27 81 1.620
Goiânia 36 108 2.160
Brasília 43 129 2.580
Outros da Região Centro-oeste 43 129 2.580

Alocação da amostra

O tamanho total da amostra de adolescentes foi calculado para permitir estimar com precisão controlada para 12 domínios definidos em função de sexo e idade dos adolescentes. Entretanto, a amostra de adolescentes é conglomerada por escolas, turnos e anos, e turmas, já que não havia cadastro de adolescentes disponível para seleção direta de uma amostra não conglomerada de adolescentes. Sendo assim, a alocação da amostra total nos 32 estratos geográficos teve que ser feita considerando características do Censo Escolar 2009 (ftp://ftp.inep.gov.br/microdados/micro_censo_escolar2009.zip, acessado em 25/Fev/2010), último disponível à época.

Para alocação do tamanho total da amostra foram testadas diferentes alternativas: alocação igual (mesmo tamanho de amostra para cada estrato); alocação proporcional (o tamanho da amostra do estrato é proporcional ao seu tamanho populacional); alocação potência (o tamanho da amostra é proporcional a uma potência do tamanho do estrato – duas potências 1/3 e 1/2 foram testadas).

Dentre as quatro formas de alocação testadas, a alocação com potência 1/3 (raiz cúbica) foi a que apresentou melhor equilíbrio entre a precisão e o tamanho de amostra disponível por domínio de estimação previsto para cada estrato.

De fato, a alocação igual garantiria o mesmo nível de precisão em todos os estratos, enquanto a proporcional asseguraria distribuição proporcional ao tamanho do estrato, mas implicaria em precisão diferenciada por estrato e uma indesejável concentração nos estratos mais populosos do país. Por fim, as alocações potência testadas (1/2 e 1/3) reduzem a diferença entre os tamanhos de amostra dos estratos, caminhando na direção da alocação igual e, portanto, na direção de uma amostra que mantém a mesma precisão por estrato geográfico, mas que conduz a um tamanho compatível que permite maior desagregação dos dados nos maiores estratos.

Considerando que a grande maioria das escolas tem três ou mais turmas dos turnos e anos considerados decidiu-se fixar a seleção de três turmas por escola. Para alcançar este objetivo e, ao mesmo tempo, manter um bom espalhamento da amostra ao longo dos turnos e anos, foram selecionadas inicialmente em cada escola três combinações de turno (manhã x tarde) e ano (EF-7, EF-8, EF-9, EM-1, EM-2, EM-3), onde EF corresponde ao Ensino Fundamental (7o ao 9o ano) e EM corresponde ao Ensino Médio (1o ao 3o ano). A média de alunos por turma, considerando a perda de 15%, ficou em torno de vinte alunos. Com esses parâmetros, foram obtidos os tamanhos das amostras de escolas e de turmas em cada estrato dividindo o tamanho da amostra de alunos por 60 e 20, respectivamente, como apresentados na Tabela 3.

Seleção da amostra de escolas

A seleção da amostra de escolas foi feita com base nos dados do Censo Escolar 2009, a fim de determinar os parâmetros de custo do projeto que permitiram elaborar o orçamento do estudo. Foi feita com probabilidade proporcional ao tamanho (PPT), sendo a medida de tamanho correspondente à razão entre o número de alunos que a escola possuía, em 2009, nos turnos e anos considerados e a distância em quilômetros entre a sede do município onde se localiza a escola e a sede do município de capital. Essa medida de tamanho objetivou reduzir o custo do deslocamento entre a capital do estado e os municípios selecionados, por meio da redução da probabilidade de seleção das escolas em municípios mais afastados da capital. Para evitar uma variabilidade grande nas medidas de tamanho, o que acarretaria variabilidade indesejável nos pesos amostrais, as faixas de distância em quilômetros foram associadas a valores: (1) até 10km, valor 1; (2) de 11 a 50km, valor 10; (3) de 51 a 200km, valor 50; (4) de 201 a 400km, valor 100; (5) de 401 a 600km, valor 150; (6) de 601 a 800km, valor 200; (7) de 801 a 1.000km, valor 250; e (8) acima de 1.000km, valor 300. As probabilidades de inclusão das escolas constam da Figura 1.

Figura 1 Esquema probabilístico da amostra do Estudo de Riscos Cardiovasculares em Adolescentes (ERICA). 

Para tentar preservar a distribuição de escolas por situação (urbana ou rural) e dependência administrativa (pública ou privada) na amostra dentro de cada estrato geográfico, foi usado o método de seleção PPT sistemático, com ordenação prévia das escolas do cadastro de seleção por estrato geográfico, situação e dependência administrativa. Essa combinação de seleção sistemática com ordenação prévia do cadastro de seleção corresponde a uma estratificação implícita por situação e dependência administrativa dentro de cada estrato geográfico.

No processo de seleção da amostra, observou-se que 23 escolas tinham uma medida de tamanho grande o suficiente para serem incluídas na amostra com certeza. Essas escolas foram incluídas na amostra e o processo foi repetido para as demais escolas e com o tamanho restante da amostra. É importante registrar que essas 23 escolas não são mais unidades primárias de amostragem (UPA) e sim estratos de seleção (Figura 1). Nestas escolas, a UPA será a combinação de turno e ano.

Feita a seleção das escolas com os critérios indicados acima, observou-se que foram selecionadas escolas em 124 (45,1%) dos 273 municípios considerados na população de pesquisa, mostrando que os critérios concentraram a amostra nos municípios sem perder a representatividade regional.

Seleção da amostra de combinações de turno e ano e de turmas

No segundo estágio de seleção foram selecionadas, inicialmente em cada escola, três combinações de turno (manhã x tarde) e ano (EF-7, EF-8, EF-9, EM-1, EM-2, EM-3) entre as existentes na escola. Esse estágio foi necessário por dois motivos: (1) para viabilizar os exames de sangue dos alunos, visto que o jejum de 12 horas inviabilizava a seleção de alunos dos turnos da tarde; e (2) para representar na amostra as diferentes idades dos adolescentes elegíveis usando o ano da turma como uma aproximação da idade. Nas marginais desse cruzamento, buscou-se uma alocação de aproximadamente 2/3 das turmas no turno da manhã, com 1/3 no da tarde, e uma alocação igual dos anos considerados. O uso dessas frações foi definido em função dos recursos disponíveis para os exames de sangue, que não cobririam mais de 2/3 do tamanho da amostra de alunos.

Em seguida, foi elaborado um algoritmo de seleção para assegurar a seleção de exatamente três combinações de turno e ano por escola de forma a respeitar o tamanho da amostra por turno e, sempre que possível, por ano. Com o emprego desse algoritmo de seleção, para cada escola da amostra foram selecionadas três combinações de turno e ano, respeitando as informações sobre a existência de turmas nos turnos e anos selecionados, como indicado na expressão (2) da Figura 1. A primeira razão na expressão (2) indica a probabilidade de inclusão da combinação turno e ano na escola e a segunda razão indica a probabilidade de inclusão da turma na combinação de turno e ano. A seleção das turmas dentre as existentes em cada combinação de turno e ano foi feita em campo, com apoio de planilhas Microsoft Excel (Microsoft Corp., Estados Unidos) preparadas para cada escola amostrada (ver exemplo na Figura 2).

Figura 2 Exemplo de planilha de seleção de turmas e subamostras de alunos. 

Essas planilhas continham a identificação completa das escolas selecionadas e duas tabelas para seleção de turmas e da subamostra de dois alunos que deveriam repetir o recordatório alimentar de 24 horas. Na primeira tabela, ao digitar, na terceira coluna, o número de turmas da combinação de turno e ano selecionada, indicada nas duas primeiras colunas, automaticamente aparecia o número de ordem da turma selecionada, em função de fórmulas pré-programadas e de números aleatórios selecionados para a escola. O número de ordem estava sempre associado à sequência das designações das turmas na escola. Na segunda tabela, foram digitados os números de alunos frequentando as aulas no momento da coleta de dados; os números de alunos relacionados a cada situação relativa ao Termo de Consentimento Livre e Esclarecido (TCLE) e de assentimento; bem como o número de alunos que participaram de cada subamostra da pesquisa (preenchimento do questionário no personal digital assistant – PDA), antropometria, pressão arterial, exame de sangue, e recordatório alimentar de 24 horas). Em função dos números aleatórios selecionados, das fórmulas pré-programadas e do total de alunos que preencheram o recordatório, apareciam nas duas colunas da direita o número de ordem dos dois alunos selecionados para repetir o recordatório. O número de ordem estava sempre associado à ordem alfabética dos nomes dos alunos que fizeram o primeiro recordatório.

Seleção dos alunos

Em princípio, todos os alunos das turmas amostradas foram incluídos com certeza na amostra. No entanto, em decorrência de falta nos dia da pesquisa, do não consentimento dos pais para coleta de sangue, ou de o aluno não ter idade elegível (12 a 17 anos), o tamanho da amostra efetiva pode ser menor do que o número de alunos da turma. Assim, probabilidade de inclusão dos alunos elegíveis nas turmas da amostra, apresentada na expressão (3) da Figura 1, equivale a tratar a amostra de adolescentes efetivamente entrevistados como uma subamostra equiprovável dos alunos elegíveis da turma, pressupondo que não há diferença importante entre os que participaram e os que não participaram na turma.

Tratamento da não resposta e das subamostras

O tratamento dado às não respostas em cada parte do estudo decorre do pressuposto de que os adolescentes pesquisados não diferem de forma importante dos não pesquisados da mesma classe. Assim, o conjunto de adolescentes pesquisados pode ser tratado como uma subamostra da amostra de adolescentes em cada parte do estudo: questionários em PDA; antropometria; pressão arterial; exame de sangue (casos coletados e que tiveram os resultados obtidos) e recordatório 24 horas.

Apesar de a Figura 1 apresentar uma única probabilidade de inclusão do adolescente, a expressão (3) foi calculada independentemente para cada subamostra. Em consequência, as expressões (4a) a (6) também podem variar segundo a subamostra considerada.

As não respostas de itens pontuais que ocorreram dentro de cada parte do estudo foram tratadas durante a crítica dos dados, da mesma forma que valores inconsistentes encontrados, por meio de correções ou imputação probabilística.

Cálculo dos pesos amostrais e sua calibração

Como indicado nas expressões (5a) e (5b) da Figura 1, o peso natural do desenho 1 é igual ao recíproco do produto das probabilidades de inclusão em cada estágio da amostra, considerando o tratamento das subamostras como um estágio de seleção.

No entanto, como em toda amostra conglomerada, os pesos calculados não refletem a distribuição da população de adolescentes estudantes (12 a 17 anos completos) por sexo e idade. Isto ocorre, também, nas pesquisas domiciliares, visto que as probabilidades de inclusão refletem os quantitativos nos vários estágios de seleção e representam bem os totais (de moradores ou de alunos), mas distorcem as distribuições por sexo e idade. Segundo Silva 3, esta é a principal razão que conduz os órgãos oficiais de estatística a calibrarem os pesos amostrais de suas pesquisas demográficas: assegurar que as estimativas reflitam dados populacionais das unidades elementares da amostra, conhecidos por fontes exógenas à pesquisa.

No ERICA, os dados populacionais de adolescentes matriculados em escolas públicas ou privadas podem ser estimados considerando as informações dos dois últimos censos demográficos realizados no país 4,5, e o método da tendência linear, que a Fundação Instituto Brasileiro de Geografia e Estatística (IBGE) usa para projetar a população dos municípios brasileiros 6, descrito por Madeira & Simões 7. As projeções foram feitas para a data de 31 de dezembro de 2013, visto que parte da amostra foi pesquisada em 2013 e parte em 2014. Adotou-se neste caso o mesmo tipo de estratégia que o IBGE utiliza em suas pesquisas de orçamentos familiares: uma data próxima ao centro do período de coleta da pesquisa.

No entanto, o método acima não permite obter totais populacionais de estudantes do turno da manhã. Para este caso, foram processados dois arquivos do Censo Escolar 2013 (ftp://ftp.inep.gov.br/microdados/micro_censo_escolar _2013.zip, acessado em 04/Mar/2014): (1) turmas; (2) matrículas. No primeiro, manteve-se o mesmo conjunto de critérios para selecionar as turmas elegíveis, enquanto no segundo calculou-se a idade para 31 de dezembro de 2013. Com a junção dos dois arquivos, a proporção de alunos do turno da manhã foi calculada por estrato geográfico, sexo e idade. Esse vetor de proporções foi aplicado sobre os totais populacionais projetados para 31 de dezembro de 2013, fornecendo o vetor de totais populacionais de estudantes do turno da manhã.

Foi utilizado um estimador de pós-estratificação, que é um caso particular do estimador de regressão descrito em Särndal et al. 8, que modifica o peso natural do desenho por um fator de calibração que corresponde à razão entre o total populacional e o total estimado pelo peso natural do desenho para o pós-estrato ou domínio de estimação considerado. Foram definidos 12 domínios de estimação correspondentes às seis idades consideradas e os dois sexos.

Estimação a partir dos dados do ERICA

A amostra do ERICA é uma amostra considerada complexa 9, uma vez que emprega estratificação e conglomeração e probabilidades desiguais em seus estágios de seleção. Estimativas pontuais não enviesadas (ou pelo menos aproximadamente não enviesadas) de parâmetros populacionais, exceto variância, podem ser obtidas com o emprego dos pesos amostrais calibrados, usando qualquer sistema estatístico que aceite ponderação.

No entanto, as estimativas usuais de variância e demais estatísticas que delas dependem (como desvios-padrão, erros padrão, intervalos de confiança de estimativas pontuais, testes de significância de parâmetros de modelos de regressão, entre outras) demandam procedimento especial de estimação. Isto ocorre porque duas fontes de variabilidade interferem nas estimativas: (1) a decorrente do desenho complexo da amostra; e (2) a advinda dos resíduos das equações de calibração.

O procedimento sugerido na literatura 8,9,10 para estimação de variâncias a partir de amostras complexas é o método do conglomerado primário, que consiste na estimação da variância entre as médias obtidas por UPA dentro de cada estrato geográfico. A maior parte dos sistemas estatísticos atualmente já incorpora rotinas para estimação de variâncias pelo método do conglomerado primário. No entanto, este método não considera a fonte de variabilidade decorrente da calibração, apenas a decorrente do desenho de amostra complexo.

Para considerar todas as fontes de variabilidade da amostra do Erica é recomendada, dentre outras, a biblioteca survey da linguagem R (The R Foundation for Statistical Computing, Viena, Áustria; http://www.r-project.org). Esta biblioteca, desenvolvida por Thomas Lumley permite replicar a calibração dos pesos amostrais, guardando em um objeto de desenho da amostra os resíduos de calibração 10.

Para tanto, as variáveis estruturais do desenho de cada subamostra de dados serão gravadas nos arquivos: estrato de seleção, código da UPA, e peso amostral (o natural e o calibrado), além dos totais populacionais usados na calibração dos pesos amostrais. Os estratos de seleção são as 23 escolas incluídas com certeza na amostra e, para as demais escolas, o estrato de seleção coincide com o estrato geográfico. Nas 23 escolas incluídas com certeza na amostra, as UPA são as combinações de turno e ano. Nos demais estratos de seleção, as UPA são as próprias escolas. O peso amostral recomendado é o peso calibrado, mas o peso natural do desenho foi mantido nos arquivos para permitir a replicação da calibração no caso de uso da biblioteca survey.

REFERÊNCIAS

1.  Cochran WG. Sampling techniques. 3rd Ed. New York: John Wiley & Sons; 1977.
Castro IRR, Cardoso LO, Engstrom EM, Levy RB, Monteiro CA. Vigilância de fatores de risco para doenças não transmissíveis entre adolescentes: a experiência da cidade do Rio de Janeiro, Brasil. Cad Saúde Pública 2008; 24:2279-88.
Silva PLN. Calibration estimation: when and why, how much and how. Rio de Janeiro: Instituto Brasileiro de Geografia e Estatística; 2004.
Instituto Brasileiro de Geografia e Estatística. Censo demográfico 2000: educação. Resultados da amostra. Rio de Janeiro: Instituto Brasileiro de Geografia e Estatística; 2003.
Instituto Brasileiro de Geografia e Estatística. Censo demográfico 2010: educação e deslocamento. Resultados da amostra. Rio de Janeiro: Instituto Brasileiro de Geografia e Estatística; 2012.
6.  Instituto Brasileiro de Geografia e Estatística. Estimativas da população residente nos municípios brasileiros com data de referência em 1o de julho de 2013. Rio de Janeiro: Instituto Brasileiro de Geografia e Estatística; 2013.
Madeira JL, Simões CCS. Estimativas preliminares da população urbana e rural segundo as Unidades da Federação, de 1960/1980 por uma nova metodologia. Revista Brasileira de Estatística 1972; 33: 3-11.
Särndal CE, Swensson B, Wretman JH. Model assisted survey sampling. New York: Springer Verlag; 1992.
Skinner CJ, Holt D, Smith TMF. Analysis of complex surveys. Chichester: John Wiley & Sons; 1989.
Lumley T. Complex surveys: a guide to analysis using R. Hoboken: John Wiley & Sons; 2010. (Wiley Series in Survey Methodology).