versão impressa ISSN 1413-8123versão On-line ISSN 1678-4561
Ciênc. saúde coletiva vol.20 no.5 Rio de Janeiro maio 2015
http://dx.doi.org/10.1590/1413-81232015205.01652014
Pay-for-performance (P4P) has been widely used around the world seeking to improve health outcomes, and in Brazil it is the basis of the National Program for Improving Access and Quality (PMAQ). The literature published between 1998 and January 2013 that evaluated the effectiveness of P4P to produce results or patterns of access and quality in health was scrutinized. A total of 138 studies, with the inclusion of a further 41 studies (14 systematic reviews, 07 clinical trials and 20 observational studies) were retrieved and analyzed Among the more rigorous studies, favorable conclusions for P4P were less frequent, whereas observational studies were more favorable to positive effects of P4P on the quality of, and access to, health services. Methodological limitations of observational studies may have contributed to these results, but the range of results is more linked to the conceptual and contextual aspects of the use of the P4P schemes reviewed, the heterogeneity of P4P models and results. P4P can be helpful in promoting the achievement of objectives in health care systems, especially in the short term and for specific actions requiring less effort of health care providers, but should be used with caution and with a rigorous planning model, also considering undesirable or adverse effects.
Key words: Pay-for-performance; Program for Improving Access and Quality (PMAQ)
O pagamento por desempenho (pay-for-performance, P4P), ou financiamento baseado em resultados (result-based-financing, RFB), consiste na transferência de dinheiro, a provedores ou serviços de saúde, condicionada a resultados alcançados em face de ações ou metas mensuráveis e predeterminadas1 - 4. Embora muitos modelos já tenham sido identificados, esquemas de P4P na saúde em geral objetivam incentivar condutas individuais ou coletivas para a obtenção de melhores resultados ou de padrões de qualidade na provisão de serviços de saúde5 , 6.
Em âmbito internacional, o P4P é defendido e utilizado para melhorar a qualidade do atendimento e alcançar metas institucionais nas políticas de saúde1 , 2. Apesar do P4P ser uma das estratégias dominantes na busca da melhoria da qualidade dos sistemas e organizações de saúde7, ainda persiste considerável lacuna nas evidências sobre sua efetividade1 , 5.
No Brasil, o Ministério da Saúde lançou, em 2011, o Programa Nacional de Melhoria do Acesso e da Qualidade da Atenção Básica (PMAQ), com o objetivo de induzir a ampliação da capacidade da gestão tripartite (federal, estadual e municipal) do Sistema Único de Saúde (SUS) e ampliação da oferta e qualidade dos serviços de Atenção Primária à Saúde (APS), em face das necessidades de saúde da população. O PMAQ instituiu recursos financeiros adicionais para os municípios participantes, os quais estão condicionados ao alcance de padrões de acesso e qualidade, e se operacionaliza em ciclos de adesão/contratualização, desenvolvimento e avaliação externa. A conclusão do primeiro ciclo de avaliação do PMAQ se deu em agosto de 2012, incluindo mais de 16 mil equipes de atenção básica, em 3700 municípios7, sendo esta iniciativa especialmente focada na estratégia Saúde da Família, modelo predominante de APS no SUS8 , 9.
No campo da investigação sobre os efeitos do P4P, ainda são pouco disponíveis estudos realizados no Brasil, mas no âmbito internacional, Oxman e Fretheim1 identificaram 12 revisões sistemáticas que avaliaram algum aspecto dos efeitos do P4P no setor de saúde, considerando pacientes, prestadores de serviços individuais, equipes de saúde, organizações e governos. Os resultados apontaram que incentivos financeiros para provedores individuais de saúde, podem ser eficazes em curto prazo, desde que reflitam sobre metas comportamentais bem definidas, distintas e simples, mas os efeitos do P4P para mudanças complexas e de longo prazo nos processos de trabalho ainda precisam ser mais estudados.
A depender do modelo adotado, o P4P também pode produzir efeitos inesperados ou indesejáveis, motivando comportamentos distorcidos (ignorar importantes tarefas não recompensadas), 'mapismo' (fraude na apresentação de relatórios), 'escolha a dedo' (seleção de pacientes com base na facilidade para atingir metas), aumento da lacuna de recursos entre os ricos e os pobres (disparidades motivadas por determinantes sociais) e dependência dos incentivos financeiros1.
Mannion e Davies5 identificaram as seguintes características presentes nos diversos modelos de P4P por eles analisados: i) objetivos e metas utilizados; ii) unidades de avaliação; iii) medidas de desempenho; iv) análise e interpretação dos dados; e v) tamanho da recompensa. Os objetivos e metas, assim como as unidades de avaliação e medidas de desempenho podem abranger uma gama de variáveis (volume de atendimentos, satisfação e segurança do usuário, custo-efetividade dos tratamentos, dentre outras possibilidades). Os incentivos financeiros podem concentrar-se em indivíduos, equipes ou instituições e o tamanho da recompensa, fator mais relevante segundo os autores, pode variar de muito pequena, produzindo efeitos insignificantes, a grandes valores, os quais podem levar a mudanças rápidas e potencialmente imprevisíveis, aumentando, inclusive, os riscos de consequências adversas5.
Diante da gama de incertezas relacionadas ao P4P, uma abordagem abrangente da literatura publicada sobre a efetividade do uso de esquemas de pagamento por desempenho para obter padrões de acesso e qualidade em serviços e sistemas de saúde, pode subsidiar a discussão e a tomada de decisão sobre a temática, que hoje integra a agenda da política nacional de saúde, notadamente no âmbito da atenção básica. Assim, o objetivo desse estudo de revisão da literatura foi identificar, avaliar e sistematizar as evidências disponíveis sobre a efetividade do P4P na saúde.
Esta revisão da literatura guiou-se pela questão-problema da efetividade do P4P em produzir resultados ou padrões de acesso e qualidade em serviços de saúde. Buscou-se identificar estudos publicados de 1998 até janeiro de 2013, incluindo-se apenas revisões sistemáticas (com ou sem metanálise), ensaios clínicos controlados e estudos observacionais, do tipo caso-controle, coorte ecross-section, que avaliaram a eficácia/efetividade do P4P para melhorar ou padronizar processos/resultados do âmbito da provisão de serviços de saúde, utilizando-se incentivos financeiros individuais, para equipes de saúde ou organizações/instituições.
Uma busca estruturada foi feita nas bases indexadas da Biblioteca Virtual em Saúde (BVS) e PubMed entre 20 de dezembro de 2012 e 20 de janeiro de 2013, utilizando-se a seguinte estratégia de sensibilização: "pay for performance" OR "pay-for-performance" OR "paying for performance" OR "financial incentives" OR "reimbursement, incentive" OR "incentive reimbursement". Também foram utilizados ainda os seguintes limites para a filtragem dos artigos de interesse, a fim de refinar os resultados iniciais da busca: > Assunto principal: Reembolso de incentivo; > Idiomas: Inglês/espanhol/português; > Ano de publicação: 2000/2012 > Tipo de estudo: Revisões Sistemáticas; Ensaios Clínicos Controlados; Estudos de Caso-Controle; Estudos de Coorte.
Para a avaliação da qualidade da evidência, utilizou-se o modelo para avaliação da qualidade de revisões sistemáticas, adaptado de Guyatt et al.10, pelas diretrizes metodológicas para elaboração de pareceres técnico-científicos do Ministério da Saúde11. Para os ensaios clínicos e estudos observacionais, a qualidade foi avaliada seguindo-se as recomendações das diretrizes metodológicas para a elaboração de revisões sistemáticas e metanálise de ensaios clínicos randomizados do Ministério da Saúde12, bem como os critérios de identificação de limitações metodológicas que resultem em viés ou erro aleatório nos resultados dos estudos, conforme preconizado por Guyatt et al.10.
Para decidir sobre o nível de recomendação da evidência, considerou-se que, dentre os estudos incluídos e após a análise crítica do desenho metodológico no atendimento aos critérios básicos de sua caracterização10 - 12, as revisões sistemáticas gozaram do nível de recomendação mais elevado, seguidas dos ensaios clínicos controlados e dos estudos observacionais (caso-controle, coorte e cross-section). Após a leitura e categorização dos artigos, os achados foram sistematizados e dispostos de forma sintética, destacando-se os objetivos e as principais conclusões, bem como o grau de recomendação da evidência sobre a efetividade do uso do P4P para melhorar ou padronizar processos/resultados do âmbito da provisão de serviços de saúde.
O pagamento por desempenho tem recebido atenção crescente da pesquisa em sistemas de saúde (Health Systems Research) e sido amplamente defendido como estratégia/ferramenta para promover mudanças comportamentais em provedores de serviços de saúde favoráveis a melhores resultados, tanto em nível individual como coletivo1 - 3. No entanto, os artigos incluídos nesta revisão apresentaram resultados contraditórios quanto à efetividade do P4P para melhorar ou obter padrões de qualidade no âmbito de serviços e sistemas de saúde utilizando incentivos financeiros baseados em resultados, a depender dos diferentes modelos conceituais, objetivos e formas de implantação.
A busca sensibilizada recuperou 138 estudos, dos quais, após análise crítica, foram incluídos 41 artigos, dos quais 14 configuraram revisões sistemáticas, 07 atenderam ao desenho de ensaios clínicos e 20 relataram estudos observacionais, conforme descrito no Quadro 1.
Quadro 1. Resultados da busca de artigos nas bases eletrônicas (PubMed e BVS). Fonte: elaboração própria.
Revisões sistemáticas diferem das revisões de literatura tradicionais por incluir apenas resultados de estudos primários de larga escala que atendam ao desenho metodológico de ensaios clínicos controlados e, quando possível, também aleatorizados, que abordem uma questão clínica claramente formulada, utilizando métodos sistemáticos e explícitos para identificar, selecionar e avaliar criticamente estudos que se enquadrem nos critérios metodológicos pré-definidos, extrair e analisar seus dados e sintetizá-los de forma clara e objetiva. Assim, as revisões sistemáticas são amplamente aceitas como as mais confiáveis fontes de evidências sobre os efeitos das intervenções de saúde e cada vez mais são usadas para identificar, avaliar e combinar evidências sobre as consequências das intervenções, considerando aspectos clínicos e econômicos, dado que sua abordagem sistemática e explícita reduz o risco de vieses e facilita a avaliação crítica dessas sínteses13.
Dentre as 37 revisões recuperadas na etapa inicial de busca, 14 estudos foram incluídos14 - 27, por atenderem ao problema proposto de investigar a efetividade do P4P para produzir melhorias nos resultados em saúde e possuírem qualidade metodológica adequada, segundo os parâmetros escolhidos nesta avaliação10 , 11. Destas, 13 constituíram revisões sistemáticas de estudos primários14 - 25 , 27 (ensaios clínicos controlados, randomizados ou não) e uma revisão de revisões sistemáticas sobre os efeitos do P4P também foi considerada28, tendo em vista a qualidade metodológica verificada nessa síntese.
As revisões sistemáticas apresentaram conclusões conservadoras acerca das evidências sobre os efeitos benéficos do P4P sobre os resultados em saúde, em parte devido ao reconhecimento da baixa qualidade metodológica comumente encontrada entre os estudos primários disponíveis sobre os efeitos do P4P, apontada em vários dos estudos14 - 18 , 22 - 27, em parte porque os autores defendem que vários aspectos do P4P ainda carecem de mais investigação, como, por exemplo, os riscos de produzir comportamentos e resultados adversos ou indesejáveis.
A melhoria de indicadores isolados, especialmente aqueles de entrega e cobertura de serviços e ações de saúde pontuais, parece ser mais facilmente alcançada pelo P4P, ao passo que os benefícios do uso do P4P para mudanças complexas e de longo prazo que incluem resultados em nível sistêmico não puderam ser completamente evidenciados14 - 18 , 22 - 27. As maiores lacunas de evidências sobre o P4P se referem aos custos e relações daí decorrentes (custo-benefício, custo-efetividade e custo-utilidade) e aos riscos potenciais envolvidos no seu uso nos diversos níveis de agente-alvo do incentivo financeiro, considerando diferentes contextos organizacionais.
Algumas conclusões encontradas nos estudos incluídos, entretanto, podem ser usadas como subsídios na averiguação e discussão dos potenciais resultados da utilização do P4P em sistemas de saúde, especialmente quanto aos seus elementos constitutivos e respectivos efeitos daí decorrentes. De forma geral, os efeitos do P4P dependeriam do modelo usado, incluindo o tipo de intervenção proposta, tamanho e frequência dos incentivos, quais as metas e objetivos buscados, como são mensurados os resultados para o pagamento dos incentivos, bem como de outros componentes institucionais, tais como a existência de suporte técnico para o programa e o contexto organizacional em que o mesmo é implantado, além de fatores de confusão de natureza socioeconômica, por exemplo. O Quadro 2 apresenta as principais conclusões das revisões sistemáticas.
Quadro 2. Síntese dos resultados da revisão da literatura (Revisões Sistemáticas). Fonte: Elaboração própria.
Em síntese, a parte considerável dos estudos concluiu pela insuficiência de evidências que suportem o uso do P4P para promover melhorias da qualidade e resultados em saúde que dependam de intervenções e mudanças complexas e de longo prazo, como, por exemplo, na redução das disparidades em saúde entre grupos étnicos e socioeconômicos, ou para melhorar de forma sistêmica os resultados dos cuidados primários em saúde. Noutro lado, ainda há incertezas sobre os riscos e custos envolvidos na utilização do P4P na saúde, sendo possível que efeitos indesejáveis ocorram, tais como desídia dos provedores individuais com tarefas que não são recompensadas, fraude de informações, aprofundamento das disparidades em saúde e dependência financeira dos incentivos15 , 18 , 26.
Entretanto, a efetividade do P4P como estratégia para mediar mudanças pontuais e de curto prazo também foi apontada por alguns dos estudos, especialmente para ampliar a cobertura de serviços ou condutas específicas, tais como ações de imunização de grupos etários por vacinação, adesão a protocolos clínicos e terapêuticos e rastreamento (screening) de doenças específicas (câncer, por exemplo)13 , 17 , 18 , 26.
Por fim, os estudos de revisão sistemática sobre os efeitos do P4P sobre medidas de desempenho e resultados em saúde, reclamam a disponibilidade de mais estudos primários com boa qualidade metodológica, que proporcionem evidências mais robustas sobre as consequências do uso do P4P na saúde14 - 27.
Ensaios clínicos controlados são estudos experimentais que visam ao conhecimento dos efeitos de intervenções em saúde, especialmente para o tratamento e diagnósticos de doenças, e consistem numa ferramenta poderosa para a obtenção de evidências para a prática clínica10. Ensaios clínicos controlados também têm sido utilizados para avaliar os efeitos de intervenções em sistemas de saúde, como demonstram os resultados da busca de artigos que relataram estudos que avaliaram os efeitos do P4P no âmbito de serviços de saúde e adotaram esse desenho metodológico.
Inicialmente, identificaram-se 71 estudos, dos quais 12 foram selecionados para leitura completa e 07 incluídos no escopo desta revisão29 - 35. Os resultados dos ensaios clínicos analisados apresentaram resultados variados acerca da efetividade do P4P, a depender do modelo e do contexto de implantação dos incentivos. Objetivos pontuais, envolvendo melhoria das coberturas de serviços ou adesão a condutas específicas parecem ser mais facilmente afetados pelo P4P, replicando aspecto já verificado nos resultados das revisões sistemáticas avaliadas nesse estudo.
Os estudos que abordaram ações pontuais identificaram resultados mais conclusivos sobre a efetividade do P4P29 - 31 , 34, sendo a intervenção associada a melhorias nas coberturas e adesão dos provedores de serviços a ações específicas em pelo menos três estudos30 , 32 , 34. Por outro lado, pelo menos dois dos estudos favoráveis ao P4P indicaram que a melhoria observada foi marginal29 - 35, e outros dois estudos não verificaram diferenças significativas entre os grupos de intervenção e de controle30 , 32. Entretanto, pelo menos um dos estudos incluídos apontou resultados muito favoráveis do uso do P4P para melhoria do acesso e qualidade de um serviço de saúde materno-infantil em nível sistêmico33, sendo esse resultado ainda mais instigante por abordar os efeitos da intervenção no contexto socioeconômico de extrema carência da África subsaariana. No Quadro 3 são apresentados os principais achados dos estudos incluídos.
Quadro 3. Síntese dos resultados da revisão da literatura (Ensaios Clínicos Controlados). Fonte: Elaboração própria.
Assim, reforça-se a perspectiva de que os efeitos do P4P são condicionados pelos elementos constitutivos dos modelos de incentivo e por fatores contextuais, que incluem elementos do âmbito institucional e do contexto socioeconômico onde a intervenção foi implantada. Nenhum dos estudos avaliou potenciais riscos ou a ocorrência de efeitos adversos/indesejáveis advindos do uso do P4P.
Dentre os 37 artigos inicialmente recuperados pela busca sensibilizada, foram incluídos 20 estudos observacionais, sendo 04 do tipo caso-controle, 03 séries temporais interrompidas, 08 estudos de coorte (retrospectiva ou prospectiva), 02 estudos longitudinais, 02 estudos transversais (cross-section) e 01 survey. Embora gozem de menor potencial de recomendação da evidência10 - 12, estudos observacionais podem contribuir com elementos relevantes para a discussão sobre a efetividade do P4P e, nessa revisão, os principais resultados encontrados, a exemplo dos resultados das revisões sistemáticas e dos ensaios clínicos controlados, também refletiram contradições. O que reforça a ideia de que o P4P não é uma intervenção uniforme, assim como os resultados passíveis de serem observados, os quais são condicionados por vários fatores que incluem especialmente o modelo e a implementação, mas também elementos contextuais que potencialmente afetam os resultados proporcionados pela intervenção.
Uma parte considerável dos artigos incluídos (07) apresentaram efeitos positivos do P4P sobre diversos desfechos de qualidade e acesso a serviços e ações de saúde28 , 36 - 41, inclusive em nível sistêmico42. Por outro lado, pelo menos sete estudos43 - 49, dentre os que foram incluídos nesta revisão, demostraram inexistir diferenças significativas associadas ao P4P entre os grupos avaliados e outros 06 identificaram efeitos adversos a partir da utilização do pagamento de incentivos associados ao desempenho37 , 46 , 49 - 52. Dois estudos, que não avaliaram especificamente a efetividade do P4P para melhorar resultados, abordaram o desenvolvimento de instrumento avaliativo dos resultados do P4P53 e a adequação dos valores pagos por procedimento ortopédico ao tempo gasto pela equipe cirúrgica54.
O Quadro 4 apresenta os principais resultados extraídos dos estudos observacionais incluídos nesta revisão. Os resultados dos estudos observacionais não forneceram suporte para reconhecer a uniformidade da efetividade dos esquemas de P4P na melhoria da qualidade ou obtenção de padrões no âmbito dos serviços de saúde. Alguns dos estudos apresentaram resultados favoráveis ao P4P e defenderam a melhoria de resultados nas condições incentivadas, enquanto outros, especialmente os que avaliaram aspectos complexos, como disparidades em saúde e resultados influenciados por contextos institucionais ou socioeconômicos, bem como os que incluíram o exame dos efeitos adversos da utilização do P4P, indicaram que resultados indesejáveis podem advir desses esquemas de incentivos, dependendo do modelo e forma de implantação, reforçando assim, as conclusões anteriormente obtidas a partir dos estudos de revisões sistemáticas e ensaios clínicos controlados incluídos nesta revisão de literatura.
Para categorização dos resultados dos diversos estudos incluídos nessa revisão, se considerou especialmente o aspecto da efetividade do P4P em face dos objetivos propostos pelo esquema estudado. Para isso, foram considerados somente os estudos que visaram especificamente a esse tipo de análise, excluindo-se do quadro síntese de resultados aqueles estudos que, embora relevantes para a discussão dos efeitos da intervenção, não avaliaram em alguma medida os resultados obtidos em função do P4P.
As revisões sistemáticas foram consideradas como a evidência de mais alto nível de recomendação (▲▲▲), seguidas dos ensaios clínicos controlados (▲▲), os quais foram considerados como evidência superior aos estudos observacionais (▲) quanto ao nível de recomendação, seguindo a classificação preconizada em âmbito internacional10 - 12. O Quadro 5 apresenta o panorama geral desta revisão, considerando a efetividade do P4P e o nível de recomendação da evidência.
Percebeu-se que dentre as evidências com mais alto nível de recomendação, as conclusões foram predominantemente conservadoras, no sentido de reconhecer a indisponibilidade de evidências que sustentem a efetividade do P4P para obtenção de melhores resultados na saúde. Por outro lado, muitos estudos também mostraram que os incentivos podem ser eficazes para produzir os resultados objetivados.
Do total de 38 estudos incluídos no Quadro 5, dentre os 13 estudos que integram o mais alto nível de recomendação (Revisões Sistemáticas), 04 foram favoráveis à efetividade do P4P, 01 contrário e 08 reconheceram a insuficiência de evidências para afirmar a efetividade da intervenção. Dentre os ensaios clínicos controlados, também considerados com estudos com bom nível de recomendação, 04 observaram a efetividade do P4P nas suas conclusões, 02 implicaram a não efetividade e 01 restou inconclusivo. Entre os estudos observacionais, 12 artigos reportaram efeitos decorrentes da utilização do P4P e 06 a indiferença dos resultados observados para com a intervenção.
Na revisão e análise da literatura publicada observou-se que, entre os estudos metodologicamente mais rigorosos, as conclusões favoráveis ao P4P se mostraram menos frequentes, enquanto os estudos observacionais foram mais favoráveis à observação de efeitos positivos do P4P sobre a qualidade e acesso a serviços de saúde. Limitações metodológicas dos estudos observacionais, com a possibilidade de vieses ou influência de fatores não controlados nas análises, podem ter contribuído para tais resultados, mas, provavelmente, a variedade de resultados encontrados está muito mais ligada a aspectos conceituais e contextuais da utilização dos esquemas de P4P avaliados, reforçando a heterogeneidade de modelos e resultados do P4P, que não pode ser considerado como uma intervenção uniforme.
Deve-se, portanto, reconhecer que o P4P como uma ferramenta potencialmente útil para promover a motivação necessária ao alcance de objetivos no âmbito de sistemas de saúde, especialmente em mudanças de curto prazo e sobre ações pontuais e que exijam menos esforço dos provedores de serviços de saúde. Entretanto, os resultados dos estudos que envolveram ações e contextos mais complexos, ainda apontam que o P4P deve ser utilizado com cautela e sua aplicação precedida pelo planejamento rigoroso do modelo a ser implantado, observando-se: o agente-alvo do esquema; objetivos pretendidos e metas a ser buscadas; forma de mensuração dos resultados, para o monitoramento e avaliação frequente dos resultados; modalidade de recompensas, quanto à frequência, valor e nível de incentivo buscado; bem como a consideração dos fatores institucionais e contextuais, os quais podem afetar de forma significativa os resultados obtidos. Por fim, deve-se considerar também a possibilidade do P4P produzir efeitos não planejados, indesejáveis ou adversos, os quais podem eventualmente superar os benefícios pretendidos.
Para o Brasil, o mapeamento, monitoramento e avaliação criteriosos do P4P na saúde, a exemplo do PMAQ, podem ampliar em escala global o conhecimento sobre possibilidades e limitações, bem como sobre os efeitos do seu uso, no entanto, também é extremamente importante que a gestão local esteja bem informada para desenvolver planejamento criterioso, que inclua as melhores evidências disponíveis, para reduzir riscos potenciais e aumentar as chances de bons resultados.