[Caso Studio] – People Analytics. Riconoscere ed evitare gli human bias nel recruiting

Glickon Blog

Nota. I dati di questo articolo sono tratti dal libro “Predictive HR Analytics” di Martin R Edwards & Kirsten Edwards, case study 5, esempio 1.

Contesto

[Caso Studio] – People Analytics: la Startup XYZ ha notevolmente aumentato la sua forza lavoro nell’ultimo anno. Adesso l’obiettivo è quello di incorporare una figura di People Analyst come parte della sua nuova strategia per continuare a mantenere un processo di assunzione accurato che contribuirà positivamente alle future decisioni aziendali.

Il nuovo People Analyst inizierà ad esplorare, in termini quantitativi, il processo di assunzione di questa azienda in rapida crescita.

Leggi anche: People Analytics: cos’è e perché è un vantaggio per l’azienda?

Caso Studio – People Analytics – Raccolta dati

Il primo passo di questa nuova attività è la raccolta dei dati dei dipendenti in termini di processo di assunzione, dal pool di candidati a quelli che sono stati  effettivamente assunti dalla startup.

People analytics caso studio_1
figura 1

I dati presentano 280 osservazioni e 9 variabili. Questa variabili indicano:

  1. Candidato: codice del richiedente, compreso tra 1 e 280.
  2. Sesso: 1=maschio | 2=femmina
  3. BAMEyn: nero, asiatico o di minoranza etnica, 1=si | 2=no
  4. ShortlistedNY: 0=candidato respinto | 1=shortlisted
  5. Intervistato: 0=candidato non intervistato | 1=intervistato
  6. FemaleONpanel: 1=pannello solo maschile | 2=intervistatore femminel incluso nel panel delle interviste
  7. OffertaNY: 1=offerta fatta al richiedente | 0=non offerto
  8. AcceptNY: 1=candidato accettato | 0=rifiutato
  9. JoinYN: 1=candidato iscritto | 0=non assunto

Analisi dei dati

Il prossimo passo è capire i dati che abbiamo. Tutte le variabili sono categoriche, quindi è possibile lavorare solo con le loro frequenze per effettuare ulteriori analisi statistiche. Iniziamo codificando le variabili in fattori.

People analytics caso studio_2
figura 1

Ora possiamo iniziare ad analizzare le diverse variabili in termini di frequenze. Prima di entrare in un’analisi più approfondita, diamo un’occhiata a queste frequenze variabili.

People analytics caso studio_1
figura 2

In breve, 280 persone hanno fatto domanda per un posto di lavoro, 88 di loro sono state selezionate (31%), 55 hanno avuto un colloquio (20%), 28 hanno presentato un’offerta (il 51% di coloro che hanno avuto un colloquio) e 18 infine sono state assunte dalla startup.

In questo articolo, ci concentreremo sull’esplorazione della relazione plausibile tra il genere dei candidati e i candidati assunti.

Iniziamo con l’analisi!

People analytics caso studio_4

People analytics caso studio_5

Il gruppo ricorrente era composto da 202 (72%) femmine e 78 (28%) maschi. Chiaramente più donne hanno fatto domanda per un posto di lavoro a XYZ rispetto ai maschi. Una domanda chiave che vogliamo esaminare è se la proporzione di donne e uomini nel pool di candidati fosse rappresentativa di questi gruppi rispetto a quei candidati effettivamente selezionati. Se troviamo una proporzione simile di maschi (28%) e femmine (72%), allora questo risultato non suggerirà alcun pregiudizio di genere. Creiamo una tabella di contingenza e alcuni grafici per far luce su questa domanda fondamentale.

People analytics caso studio_6
figura 1
People analytics caso studio_7
figura 2
People analytics caso studio_1
Figura 3

I risultati sono molto tangibili. Guardando la tabella di contingenza e il grafico a barre, vediamo che tra i candidati considerati in grado di passare alla fase successiva hanno una distribuzione maschi-femmine del 43% Vs 57% che salta all’occhio considerando la distribuzione iniziale dei candidati 28%-72%. Inoltre, il numero totale di candidati maschi e femmine che sono stati selezionati nell’elenco è presentato nella Figura 3. Solo osservandolo, vediamo che c’era approssimativamente una proporzione uguale tra i maschi rifiutati e selezionati. Tuttavia, guardando le femmine, la proporzione di coloro che sono stati respinti è stata considerevolmente maggiore rispetto a quelli che sono stati selezionati.

A questo punto, l’analisi fornisce alcune prove rispetto ad una preferenza per i maschi nel processo di shortlisting. Ciononostante, in questa fase non possiamo rifiutare il fatto che i risultati esposti possano essere avvenuti solo per caso. Eseguiamo un Test chi-quadro per vedere se i nostri risultati sono significativi o meno.

Nota. Il test del chi-quadro consiste nell’analisi dell’eventuale esistenza di una relazione tra due variabili categoriche (ovvero, le osservazioni fatte sulla preferenza maschile nelle selezioni sono significative da un punto di vista statistico?). Con questo test fondamentalmente confrontiamo le frequenze delle nostre variabiali categoriche che osserviamo con quelle che ci aspettiamo di ottenre con la distribuzione 28%-72% iniziale.

Prima di trarre conclusioni, dobbiamo assicuraci di non violare alcuna ipotesi per l’esecuzione del Test chi-quadro con i dati che abbiamo. Dobbiamo assicurarci che le nostre variabili siano indipendenti e che ogni categoria abbia almeno 5 osservazioni attese.

L’assunzione dell’indipendenza è molto semplice; infatti perché il chi-quadro sia significativo ogni candidato deve contribuire a una sola cella della tabella di contingenza. Guardando alla nostra tabella di contingenza, avevamo richiedenti che erano sia maschi che femmine e che erano respinti o preselezionati, quindi l’ipotesi di indipendenza può considerarsi rispettata.

La seconda ipotesi da verificare riguarda il numero di osservabili categoriche attese. Infatti perché il test chi-quadro sia significativo tale valore per ogni categoria non deve essere minore di 5. In sostanza, potremmo calcolare ciascuna delle frequenze previste per le quattro celle della nostra tabella di contingenza come segue (dove il totale delle righe e il totale delle colonne sono abbreviati in RT e CT, rispettivamente).

People analytics caso studio_9
figura 4

model_male_rejected = (RT.male x CT.rejected) / 280 = (78 x 192)/280 = 53,5

Fortunatamente, R può fare il resto dei 3 conteggi.

People analytics caso studio_1
figura 5

Come possiamo vedere, il valore più basso è 24,51, quindi abbiamo verificato che le assunzioni del test chi-quadro sono rispettate.

Ora possiamo controllare il risultato del chi-quadro.

People analytics caso studio_1
figura 6

Il risultato è molto significativo al p < 0.001, il che significa che esiste un’associazione tra il genere dei candidati e i candidati selezionati. Infatti il significato dell’espressione p < 0.001 è che nell’ipotesi di una selezione dei candidati equidistribuita fra generi, la distribuzione reale delle selezioni fra maschi e femmine si verificherebbe in meno di 1 caso su 1000. Tuttavia, il risultato del chi-quadro non può dirci quale cella sta contribuendo di più a questa associazione, per controllarla dobbiamo guardare ai residui standardizzati del chi-quadro.

People analytics caso studio_12
figura 7

Senza andare troppo in profondità nelle statistiche, i residui standardizzati sono uno z-score con una media di 0 e una deviazione standard di 1. Conoscendo questo, possiamo valutare il significato di ciscun valore di cella come segue:

Valore della cella > + – 1,96= p<.05 *

Valore della cella > + – 2,58= p<.01 **

Valore della cella > + – 3,29= p<.001 ***

Osservando i residui del chi-quadro, l’unico valore significativo della cella è quello Male_Shortlisted (2.72, p. 01 **). Pertanto, possiamo essere certi che le differenze nel genere dei candidati, che sono nella rosa dei candidati, siano dovute all’elevata proporzione di maschi nel computo totale della rosa rispetto alle femmine.

L’ultimo passaggio nella nostra analisi di genere calcola la dimensione dell’effetto. Per fare ciò, calcoleremo il rapporto di probabilità dei nostri dati. Odd Ratio è una metrica molto semplice e diretta per esprimere la dimensione dell’effetto dei dati categorici.  E’ più interpretabile nel confronto focalizzato (cioè, 2×2 tabelle di contingenza come quella nel nostro caso).

People analytics caso studio_13
figura 8

Per derivarlo, per prima cosa calcoliamo le probabilità che un candidato sia stato respinto, dato che era maschio, diviso per il numero di donne che sono state respinte.

odds_gender_rejected = male_rejected (40) / female_rejected (152) = .26

Successivamente, calcoliamo le probabilità che un candidato sia stato preselezionato, dato che era maschio, diviso per il numero di donne che erano state selezionate.

odds_geneder_shortlisted = male_shortlisted (38) / female_shortlisted (50) = . 76

L’ultimo calcolo è semplicemente dividendo odds-gender_rejected da odds_gender_shortlisted.

odds_ratio = .26/.76 = . 35

Caso Studio – People Analytics – Conclusione

Ora, possiamo basare le nostre conclusioni sulla nostra analisi statistica. Possiamo dire che:

Il risultato altamente significativo del chi-quadro indica che vi è un’associazione significativa tra il genere dei candidati e i candidati che sono stati selezionati o meno. Il risultato è significativo a p <.001, il che significa che ci sono meno di 1 su 1000 possibilità di trovare l’associazione. Dai residui standardizzati, la cella “maschi selezionati” è l’unica significativa che contribuiva alle differenze nei risultati del chi-quadro, quindi le differenze tra i candidati erano nella rosa dei candidati stessi. Il rapporto mostra appunto, che le probabilità che i candidati siano nella rosa erano 35 volte più alte se fossero stati maschi invece di femmine.

Caso Studio – People Analytics – Raccomandazioni

Sulla base dei risultati dell’analisi di genere, abbiamo la prova che vi è una preferenza maschile nel processo di shortlisting della azienda XYZ. Tuttavia, sebbene il risultato sia statisticamente significativo, dovremmo condurre ulteriori analisi prima di poter discutere qualsiasi tipo di pregiudizio di genere nel processo di assunzione. Forse, i candidati maschi erano dei candidati più forti delle femmine, tuttavia, a parità di condizioni non ci aspetteremmo questo schema. Inoltre, le differenze individuali dei candidati, come la loro età o personalità, potrebbero giocare un ruolo significativo nelle scoperte appena fatte.

 

Vuoi parlare di People Analytics? o hai in mente di creare un progetto di analisi all’interno della tua azienda? Parliamone!