Script R per “Le aziende si fanno concorrenza per attirare competenze”

Il paper è presentato qui: https://labourcomplexity.montaletti.com/sintesi-di-predicting-labor-market-competition-leveraging-interfirm-network

Il codice è disponibile a questo link: https://github.com/gmontaletti/labour-complexity/blob/main/R/Labour_market_competition.R

#code

Scopi dello Script

Lo script R implementa computazionalmente il framework metodologico presentato nel lavoro di Liu, Pant e Sheng (2023) “Predicting Labor Market Competition: Leveraging Interfirm Network and Employee Skills”. Gli obiettivi principali dello script sono:

1. Riproduzione Metodologica

Replicare fedelmente l'approccio innovativo degli autori per la predizione della competizione nel mercato del lavoro attraverso l'integrazione di:

2. Validazione Empirica

Dimostrare l'efficacia predittiva superiore delle metriche basate su network rispetto agli approcci tradizionali di classificazione industriale, confermando i risultati originali che mostrano miglioramenti dell'AUC del 18-34%.

3. Operazionalizzazione del Framework 2-D

Implementare il modello bidimensionale di analisi competitiva che combina sovrapposizione nel mercato del prodotto (product market overlap) e sovrapposizione nel mercato del lavoro (labor market overlap) per identificare diversi tipi di competitor.

Principali Funzionalità e Collegamento al Lavoro Originale

Generazione di Dati Sintetici

Funzione: generate_synthetic_data()

Collegamento teorico: Replica la struttura del dataset LinkedIn utilizzato dagli autori, contenente 89.000+ profili di dipendenti di 3.467 aziende pubbliche (2000-2014).

Componenti implementati:

Costruzione delle Metriche di Sovrapposizione del Capitale Umano

Skill-Based Labor Overlap

Funzioni: create_firm_skill_matrix(), create_skill_term_similarity_matrix()

Collegamento teorico: Implementa le metriche di sovrapposizione delle competenze esplicite attraverso:

Skill Topic Modeling

Funzioni: create_skill_topics(), create_skill_topic_similarity_matrix()

Collegamento teorico: Operazionalizza l'approccio di topic modeling degli autori per catturare competenze latenti e conoscenze tacite attraverso:

Analisi delle Reti di Flusso del Capitale Umano (HCF Networks)

Costruzione della Rete

Funzioni: create_hcf_network(), calculate_upstream_similarity(), calculate_downstream_similarity()

Collegamento teorico: Replica l'innovativa metodologia di network analysis che distingue tra:

Proprietà Strutturali della Rete

Funzioni: detect_communities(), create_community_similarity_matrix()

Collegamento teorico: Conferma empiricamente le proprietà “small-world” identificate dagli autori:

Modellazione Predittiva Multi-Dimensionale

Architettura dei Feature Sets

Funzione: evaluate_feature_sets()

Collegamento teorico: Implementa la strategia di validazione incrementale degli autori attraverso quattro categorie di variabili:

  1. Economic Features: Caratteristiche finanziarie e dimensionali delle aziende

  2. Product Market Features: Similarità basata su codici SIC

  3. Labor Market Features: Metriche di sovrapposizione delle competenze

  4. Network Features: Similarità strutturali nelle reti HCF

Machine Learning Pipeline

Funzioni: train_and_evaluate_rf(), prepare_prediction_data()

Collegamento teorico: Replica l'approccio di machine learning degli autori:

Framework di Analisi Competitiva 2-D

Funzione: plot_2d_competition()

Collegamento teorico: Operazionalizza il modello bidimensionale degli autori che classifica i competitor in quattro categorie:

  1. Direct Competitors: Alta sovrapposizione sia nel prodotto che nel lavoro

  2. Indirect Competitors: Alta sovrapposizione nel prodotto, bassa nel lavoro

  3. Potential Competitors: Bassa sovrapposizione nel prodotto, alta nel lavoro

  4. Weak Competitors: Bassa sovrapposizione in entrambe le dimensioni

Validazione dei Risultati Metodologici

Lo script conferma i principali findings empirici del paper originale:

Implicazioni Teoriche e Metodologiche

Lo script dimostra computazionalmente come:

  1. I confini tradizionali dell'industria siano inadeguati per catturare la competizione per il capitale umano

  2. Le reti di mobilità del personale rivelino dimensioni competitive nascoste non catturate dalle classificazioni SIC

  3. L'integrazione di conoscenze esplicite e tacite attraverso skill-based metrics e network analysis fornisca una rappresentazione più accurata delle capabilities aziendali

  4. Il machine learning applicato a dati di network possa identificare pattern competitivi non evidenti attraverso approcci tradizionali

Struttura Computazionale

Lo script è organizzato in cinque moduli principali:

  1. Data Generation: Simulazione di ecosistemi aziendali realistici

  2. Metrics Construction: Calcolo delle metriche di sovrapposizione multi-dimensionali

  3. Network Analysis: Costruzione e analisi delle reti HCF

  4. Predictive Modeling: Implementazione del pipeline di machine learning

  5. Results Visualization: Rappresentazione grafica dei risultati e validazione empirica

Questa architettura modulare consente la replicazione sistematica della metodologia originale.

Giampaolo Montaletti

Orcid LinkedIn montaletti.com