📙 Tem que acabar a avaliação de desempenho (sem paywall)

Resumo comentado de “Definindo a escala em análises de desempenho”, capítulo 23 de “Ruído: Porque tomamos más decisões e como podemos evitá-lo”.

jun 29, 2026

Seja o número 1 da sua divisão no trimestre e ganhe uma festa do waffle.
— Documentos internos das Indústrias Lumon

Eu sou contra avaliações de desempenho nas empresas. Pronto, falei. Odeio tanto, mas tanto, avaliação de desempenho que resolvi liberar esse resumo comentado do livro Ruído para todo mundo que assina a newsletter do Boa Noite Internet, o famoso tirar o paywall.

O processo é cercado de boas intenções — uma busca por “justiça” nas promoções, o fim das panelinhas e do puxa-saquismo —, mas, no fim, só troca um sistema falho por outro… por outro, por outro. Uma coisa é medir quantos parafusos um operário fabrica por dia em um torno (ou seja lá qual máquina é usada para fazer um parafuso). Outra é tentar pôr números (mesmo disfarçados com nomes como “perf”) em trabalho de escritório, que depende de criatividade e de interação humana. Também não ajuda o fato de que boa parte dos nossos empregos provavelmente é inútil.

Oito anos atrás, larguei o meu “emprego dos sonhos” por uma porção de motivos, mas um dos principais era que eu ficava literalmente doente a cada seis meses, na época da avaliação. O sistema me parecia falho desde a largada. Por exemplo, ele só media o que tinha sido feito naquela janela de seis meses, então ia bem quem fosse malandro o bastante para começar e terminar as coisas dentro dela. Até aí tudo bem, mas o sistema usava o “ranking forçado”, que vai ser explicado neste capítulo — que também parte de um bom propósito. Sem ele, a tendência do gerente é dizer que todo mundo foi bom o suficiente. A curva forçada existe justamente para barrar isso e fazer com que pelo menos alguém seja o que “mandou mal”. Na prática, se eu arrancasse o meu próprio couro no semestre, mas todos os meus colegas fizessem o mesmo (porque, afinal, somos todos pessoas de alta performance), a resposta vinha mais ou menos assim: “Cris, sabe o que é? Você mandou bem, mas o Joãozinho mandou melhor, então você desce um degrau na classificação.” Com consequência financeira (bônus menor) e até uma possível demissão, em caso de reincidência.

Para piorar, a empresa era global, com sede nos Estados Unidos. Os gerentes gringos, portanto, defendiam as suas equipes no próprio idioma, enquanto o resto do mundo se virava numa videoconferência em inglês. Mas, tá, eu tenho minha culpa no cartório. Eu simplesmente não soube lidar com tudo aquilo — até porque, quando saí, o meu gerente já era estadunidense, então nem posso usar essa justificativa do idioma. Sei que outros colegas sobreviveram mais anos do que eu. (Embora o meu analista, na época, tenha me lembrado que eu não tinha como saber o que se passava na cabeça de cada um, não dava para sair assumindo que estivessem todos bem.) E parte da tal “expectativa” era que eu tivesse fibra mental para aguentar a pressão. Eu não tanquei e saí antes que a coisa piorasse.

Aliás, já que estou falando em “expectativa” e no meu analista, essa história eu já contei no podcast, anos atrás. Na tal avaliação semestral, a nota vinha com a palavra “expectativa” em todos os níveis: “atingiu algumas expectativas” não dava bônus nenhum (e, repetida, levava à demissão, como falei ali em cima), “atendeu todas as expectativas” valia o bônus cheio, e “redefiniu as expectativas” rendia o triplo, com direito a chuva de ações da empresa.

Nessa hora da conversa, o analista virou e perguntou: peraí, todas as notas têm a palavra “expectativa”? Quando eu confirmei que sim, ele esfregou as mãozinhas e disse: hum, então eu vou ganhar muitos pacientes colegas seus.

Uma avaliação inteira baseada na palavra “expectativa” é uma máquina de produzir frustração, porque coloca no outro (alô, Lacan!) o julgamento de quem eu sou como pessoa. Segundo Daniel Kahneman, Olivier Sibony e Cass R. Sunstein, a palavra, em vez de ajudar, produz uma montanha de ruído — que já foi medido.

Quando uma empresa junta a avaliação de várias pessoas sobre o mesmo funcionário — o famigerado feedback 360 graus —, dá para separar o quanto da nota reflete o trabalho real e o quanto é só ruído. Os estudos que fazem essa conta, reunidos pelos três, mostram que entre 70% e 80% do que vira a nota de alguém não tem nada a ver com o trabalho daquela pessoa. Sobra de 20% a 30% para o desempenho de verdade.

a relação entre desempenho profissional e análises de desempenho profissional tende a ser fraca ou, na melhor das hipóteses, incerta.

Ou seja, a nota que decide o bônus — ou demissão — diz muito mais sobre quem avaliou do que sobre quem foi avaliado.

De onde vem tanto ruído? Dos mesmos lugares que o livro já tinha mapeado nos capítulos anteriores. A mesma pessoa recebe notas diferentes porque um avaliador é mais gentil e o outro mais severo, ou porque um deles simplesmente não vai com a sua cara, ou porque, na manhã da avaliação, um dos avaliadores deu um totó que amassou o carro. O humor de quem segura a caneta vai afetar muito a nota.

E nem todo desvio é sem querer. O gerente pode inflar a nota para evitar uma conversa difícil, para emplacar a promoção de um protegido ou até para se livrar de um subordinado ruim, que só consegue ser transferido de área se
levar uma boa avaliação na bagagem. E, cá entre nós, o papel do gerente não é fazer todo mundo performar bem? Se meu gerenciado vai mal, será que isso vai impactar a minha avaliação? Opa, pensando bem, até que ele não foi tão mal assim não! Vamos achar o lado positivo para eu não ter que me explicar para o meu chefe. Ai como eu sou um chefe cuidadoso.

Somando tudo, isso produz cenas como a de uma grande indústria que descobriu ter classificado 98% dos seus gerentes como “correspondendo plenamente às expectativas”. Quando quase todo mundo recebe o mesmo carimbo, a nota deixa de medir qualquer coisa.

Por, meus amigos Kahneman, Sibony e Sunstein, são pessoas avaliando subjetivamente outras pessoas!!!

Para curar esse efeito, muita empresa adota a minha amada (itálicos sarcásticos) curva forçada. Jack Welch a transformou em bandeira quando comandava a General Electric, proibindo os avaliadores de dar nota alta para todo mundo e obrigando cada um a distribuir as notas numa curva predefinida. Forçar a curva até reduz um tipo de ruído de forma automática, porque obriga o avaliador gentil e o severo a fechar na mesma média. Mas cria problemas maiores do que resolve.

O primeiro é confundir desempenho absoluto com relativo. É impossível que 98% dos gerentes estejam entre os 20% melhores, e a curva corrige isso. Só que Kahneman, Sibony e Sunstein explicam exatamente o que contei na abertura: não é nada impossível que todos os avaliados, de fato, atendam às expectativas se a expectativa foi definida em termos absolutos. “Você bateu a meta em 100%, mas o João bateu em 120%, então você está abaixo das expectativas”. É como eu sempre digo, o capitalismo não está nem aí pra sua saúde mental.

Quem zombaria da leniência dos procedimentos de gestão de desempenho da Nasa se escutasse que todos os astronautas em uma missão espacial bem-sucedida atenderam plenamente às expectativas?

Essa “piada” da Nasa também mostra que a curva forçada também tem problemas puramente matemáticos. Mesmo que o desempenho da empresa inteira se espalhe numa curva bonita, uma equipe pequena não tem nenhuma obrigação de repetir esse desenho. Se você sorteia dez pessoas de uma população enorme, a chance de exatamente duas caírem entre os 20% melhores é de só 30%. Na prática, o time quase nunca sai com o desenho que a curva exige. E os times não são sorteados, é uma boa prática corporativa juntar as melhores pessoas possíveis na mesma equipe. Quando o avaliador tem na frente cinco pessoas igualmente competentes e é obrigado a ranquear, acaba inventando uma diferença que não existe.

Ouvi, décadas atrás, uma história sobre a Microsoft que mostra bem aonde isso leva (espero que já tenham mudado). Lá, a curva forçada era aplicada dentro de cada equipe direta, nunca mais de dez pessoas. O resultado é que não demorou muito para os funcionários perceberem que a melhor estratégia corporativa era estar sempre, como vou dizer isso…, cercado de incompetentes.

Lembrei agora de um e-mail que nosso VP Global costumava mandar antes do começo de cada ciclo de avaliação lembrando que tirar “atendeu a todas as expectativas” não era uma coisa ruim, porque “nossas expectativas são altas”. Que é um jeito fofo de dizer: “Você se matou de trabalhar? Pois era isso mesmo que esperávamos.”

a falha fatal do ranking forçado não está em “ranquear”, mas em “forçar”.

Ordenar pessoas, quando a ordem importa de verdade, até ajuda a cortar ruído. O estrago vem de espremer uma régua numa realidade que não tem aquele formato.

A saída que o livro propõe passa por acertar a régua, sem precisar abandonar o ranking. Em vez de pedir uma nota solta de 1 a 5 (com a palavra “expectativas” dentro ou não), dá para comparar cada pessoa a casos concretos de referência — “Fulano se parece mais com o exemplo A ou com o exemplo B?” —, trocando um chute absoluto por uma comparação, e já aprendemos que comparação gera menos ruído. A técnica existe há décadas e funciona. Quase ninguém usa, porque dá trabalho, custa caro e, a parte que o livro diz com todas as letras, porque tira do gerente o poder de puxar a nota para onde lhe convém.

Em vez de afinar a régua, muita empresa de tecnologia preferiu jogar tudo fora e largar a avaliação anual com nota. A Deloitte foi uma delas. Depois de calcular que gastava 2 milhões de horas por ano avaliando 65 mil pessoas, e de concluir que a nota era mais um retrato do avaliador do que do avaliado, ela trocou a velha avaliação anual por conversas curtas e frequentes ao longo do ano.

Se funcionou melhor, ainda é cedo para dizer. Insatisfação com o modelo antigo, de todo modo, não falta. Num estudo da mesma Deloitte, cerca de 90% dos gerentes, funcionários e gente de RH acham que o processo tradicional de avaliação não entrega o que promete. Se você mede desempenho, dizem os três autores, as suas avaliações “são provavelmente dominadas pelo ruído de sistema e, por esse motivo, podem ser em essência inúteis e muito possivelmente contraproducentes”. Eles chegam a admitir, quase de passagem, que talvez nem faça sentido medir desempenho individual num trabalho onde o resultado depende de como as pessoas se misturam, e que “motivar” gente pelo medo e pela ganância de uma nota pode simplesmente não funcionar.

Tem que acabar a avaliação de desempenho.

Agora é com você

Sabe o que mais tenta ser um processo “justo” e “sem viés” e que tem que acabar? Processo de seleção de emprego, o tema do próximo capítulo. Lá vou eu passar raiva de novo.

Enquanto isso, me conta nos comentários (também abertos para todo mundo) suas experiências com processos de avaliação corporativos. Habla mesmo.

O Clube de Cultura do Boa Noite Internet normalmente é um lugar restrito a assinantes onde viajamos juntos por um livro, série, filme, etc. na forma de resumos comentados como esse, onde junto minha visão ao que é discutido em cada obra. Esta já é a décima sétima edição e se você apoiar o Boa Noite Internet vai ter acesso não só às futuras edições, mas tudo que já passou por aqui.

Nos vemos lá,
crisdias

Discussão sobre este post

Pronto para mais?