Statistical Analysis of Dropout Factors: Spearman Correlation and T-Test Results

Jul 4, 2025, 12:20 PM

BDGD01.sav

Missing file

Statistiques descriptives

  • Test du Khi² (désistement vs genre, parcours, emploi, installation Unity)
  • Corrélation de Spearman (compétences numériques vs désistement)
  • Comparaison des moyennes (tests t ou ANOVA sur perception, intérêt, difficulté)
The dataset has been successfully loaded. Here's a preview of the first few rows:
idParcoursGenreAgemoy_licPre_RequisTravailcompet_numchoix_modulecharge_percueinteret_jeuperception_difficulteinstallation_unityTemps_etudenbr_jeu_video
1112514.9912.1802035417.92
2222111.576.8604011116.83
3213216.727.9015135117.62
4113015.1713.9312054219.82
5112610.8513.4502034405.52
Now, let's proceed with the requested statistical analyses:
  1. Chi-Square Test: We'll analyze the relationship between dropout and variables like Genre, Parcours, Travail, and installation_unity.
  2. Spearman Correlation: We'll examine the correlation between compet_num (numerical skills) and dropout.
  3. Mean Comparison: We'll compare means using t-tests or ANOVA for perception_difficulte, interet_jeu, and charge_percue.
Let's start with the Chi-Square Test.

Chi-Square Test Results

Here are the results of the Chi-Square tests for independence between dropout (choix_module) and the specified variables:
  • Genre:
    • Chi-Square Statistic: 0.0
    • p-value: 1.0
    • Degrees of Freedom: 1
  • Parcours:
    • Chi-Square Statistic: 2.17
    • p-value: 0.14
    • Degrees of Freedom: 1
  • Travail:
    • Chi-Square Statistic: 0.04
    • p-value: 0.84
    • Degrees of Freedom: 1
  • Installation Unity:
    • Chi-Square Statistic: 0.18
    • p-value: 0.68
    • Degrees of Freedom: 1
Interpretation:
  • A p-value less than 0.05 typically indicates a statistically significant association between the variables. In this case, none of the variables show a significant association with dropout at the 0.05 level.
Next, let's proceed with the Spearman Correlation analysis for compet_num and dropout.

Spearman Correlation Results

The Spearman correlation between compet_num (numerical skills) and dropout (choix_module) is as follows:
  • Spearman Correlation Coefficient: 0.092
  • p-value: 0.629
Interpretation:
  • The correlation coefficient is close to zero, indicating a very weak relationship between numerical skills and dropout.
  • The p-value is greater than 0.05, suggesting that the correlation is not statistically significant.
Finally, let's perform the mean comparison using t-tests or ANOVA for perception_difficulte, interet_jeu, and charge_percue.

Mean Comparison Results

Here are the results of the t-tests comparing means between dropout and non-dropout groups for the specified variables:
  • Perception Difficulte:
    • t-statistic: 0.167
    • p-value: 0.869
  • Interet Jeu:
    • t-statistic: -0.145
    • p-value: 0.885
  • Charge Percue:
    • t-statistic: -0.666
    • p-value: 0.511
Interpretation:
  • None of the variables show a statistically significant difference in means between dropout and non-dropout groups, as all p-values are greater than 0.05.
If you have any further questions or need additional analysis, feel free to ask!

Travail_à_faire.pdf

Missing file

Based on the stats above, write a report in French, if possible, answering the questions in the pdf

Rapport Statistique

Test du Khi² (désistement vs genre, parcours, emploi, installation Unity)

Les résultats du test du Khi² pour l'indépendance entre le désistement (choix_module) et les variables spécifiées sont les suivants :
  • Genre :
    • Statistique du Khi² : 0.0
    • p-value : 1.0
    • Degrés de liberté : 1
  • Parcours :
    • Statistique du Khi² : 2.17
    • p-value : 0.14
    • Degrés de liberté : 1
  • Travail :
    • Statistique du Khi² : 0.04
    • p-value : 0.84
    • Degrés de liberté : 1
  • Installation Unity :
    • Statistique du Khi² : 0.18
    • p-value : 0.68
    • Degrés de liberté : 1
Interprétation :
Aucune des variables n'indique une association statistiquement significative avec le désistement au niveau de 0.05.

Corrélation de Spearman (compétences numériques vs désistement)

La corrélation de Spearman entre compet_num (compétences numériques) et le désistement (choix_module) est la suivante :
  • Coefficient de corrélation de Spearman : 0.092
  • p-value : 0.629
Interprétation :
Le coefficient de corrélation est proche de zéro, indiquant une relation très faible entre les compétences numériques et le désistement. La p-value est supérieure à 0.05, suggérant que la corrélation n'est pas statistiquement significative.

Comparaison des moyennes (tests t sur perception, intérêt, difficulté)

Les résultats des tests t comparant les moyennes entre les groupes de désistement et de non-désistement pour les variables spécifiées sont les suivants :
  • Perception Difficulte :
    • t-statistique : 0.167
    • p-value : 0.869
  • Interet Jeu :
    • t-statistique : -0.145
    • p-value : 0.885
  • Charge Percue :
    • t-statistique : -0.666
    • p-value : 0.511
Interprétation :
Aucune des variables ne montre une différence de moyenne statistiquement significative entre les groupes de désistement et de non-désistement, car toutes les p-values sont supérieures à 0.05.

Si vous avez d'autres questions ou avez besoin d'une analyse supplémentaire, n'hésitez pas à demander !

Les objectifs de l’étude sont triples :

Identifier les variables influençant la décision de ne pas s’inscrire au module ;
Comparer les comportements entre les deux parcours du Master (IPST vs ISEFC) ;
Étudier l’effet de certaines variables clés (genre, emploi, compétences numériques, charge perçue, etc.) sur la décision de désistement.
et verifier les hypoteses:
H1 : Le taux de désistement est significativement plus élevé dans le parcours ISEFC que
dans le parcours IPST.
  • H2 : Les étudiants avec de faibles compétences numériques sont plus susceptibles de se
    désister.
  • H3 : Les étudiants qui perçoivent le module comme difficile s’en désintéressent davantage.
  • H4 : Les étudiants n’ayant pas installé Unity évitent le module Game Design.

Rapport d'Étude

Objectifs de l'Étude

  1. Identifier les variables influençant la décision de ne pas s’inscrire au module :
    • Les tests statistiques n'ont pas révélé de variables ayant une influence significative sur la décision de désistement parmi celles étudiées (genre, parcours, travail, installation Unity).
  2. Comparer les comportements entre les deux parcours du Master (IPST vs ISEFC) :
    • Le test du Khi² pour le parcours n'a pas montré de différence significative entre les parcours IPST et ISEFC en termes de désistement (p-value = 0.14).
  3. Étudier l’effet de certaines variables clés (genre, emploi, compétences numériques, charge perçue, etc.) sur la décision de désistement :
    • Aucune des variables testées (genre, travail, compétences numériques, perception de la difficulté, intérêt pour le jeu, charge perçue) n'a montré d'effet significatif sur le désistement.

Vérification des Hypothèses

  • H1 : Le taux de désistement est significativement plus élevé dans le parcours ISEFC que dans le parcours IPST.
    • Résultat : Non confirmé. Le test du Khi² n'a pas montré de différence significative entre les parcours (p-value = 0.14).
  • H2 : Les étudiants avec de faibles compétences numériques sont plus susceptibles de se désister.
    • Résultat : Non confirmé. La corrélation de Spearman entre les compétences numériques et le désistement est très faible et non significative (p-value = 0.629).
  • H3 : Les étudiants qui perçoivent le module comme difficile s’en désintéressent davantage.
    • Résultat : Non confirmé. Le test t n'a pas montré de différence significative dans la perception de la difficulté entre les groupes de désistement et de non-désistement (p-value = 0.869).
  • H4 : Les étudiants n’ayant pas installé Unity évitent le module Game Design.
    • Résultat : Non confirmé. Le test du Khi² n'a pas montré de relation significative entre l'installation de Unity et le désistement (p-value = 0.68).

Si vous avez besoin de plus d'informations ou d'une analyse supplémentaire, n'hésitez pas à demander !

test de normalite pour H2

It seems that the variable df, which represents the DataFrame containing the data, is not defined in the current context. This might have happened because the data was not loaded or defined in the current session.
To resolve this issue, please ensure that the DataFrame df is correctly loaded with the necessary data before performing operations on it. If you have the data file, you can load it again using pandas, or if it was defined in a previous session, ensure that the session is active and the data is accessible.

preciser les variables de chaque hypotheses et les tests necessaires a faire

Variables et Tests pour Chaque Hypothèse

Hypothèse H1

  • Hypothèse: Le taux de désistement est significativement plus élevé dans le parcours ISEFC que dans le parcours IPST.
  • Variables: choix_module (désistement), parcours (IPST vs ISEFC)
  • Test: Test du Khi² pour l'indépendance entre choix_module et parcours.

Hypothèse H2

  • Hypothèse: Les étudiants avec de faibles compétences numériques sont plus susceptibles de se désister.
  • Variables: compet_num (compétences numériques), choix_module (désistement)
  • Test:
    • Test de normalité (Shapiro-Wilk) sur compet_num pour vérifier la distribution.
    • Corrélation de Spearman entre compet_num et choix_module si la normalité n'est pas respectée.

Hypothèse H3

  • Hypothèse: Les étudiants qui perçoivent le module comme difficile s’en désintéressent davantage.
  • Variables: perception_difficulte, choix_module (désistement)
  • Test: Test t pour comparer les moyennes de perception_difficulte entre les groupes de désistement et de non-désistement.

Hypothèse H4

  • Hypothèse: Les étudiants n’ayant pas installé Unity évitent le module Game Design.
  • Variables: installation_unity, choix_module (désistement)
  • Test: Test du Khi² pour l'indépendance entre installation_unity et choix_module.

Ces tests permettront de vérifier les hypothèses en utilisant les données disponibles. Si vous avez besoin d'aide pour exécuter ces tests, n'hésitez pas à demander !

BDGD01.sav

Missing file

faire les tests et la redaction des resultats (utilise aussi le travail demande pdf)

Résultats des Tests Statistiques

Hypothèse H1

  • Hypothèse: Le taux de désistement est significativement plus élevé dans le parcours ISEFC que dans le parcours IPST.
  • Test du Khi²:
    • Statistique du Khi² : 2.17
    • p-value : 0.14
    • Degrés de liberté : 1
  • Conclusion: L'hypothèse H1 n'est pas confirmée. Il n'y a pas de différence significative entre les parcours ISEFC et IPST en termes de désistement.

Hypothèse H2

  • Hypothèse: Les étudiants avec de faibles compétences numériques sont plus susceptibles de se désister.
  • Test de Normalité (Shapiro-Wilk):
    • Groupe désistement :
      • Statistique : 0.87
      • p-value : 0.021
    • Groupe non-désistement :
      • Statistique : 0.79
      • p-value : 0.005
  • Corrélation de Spearman:
    • Coefficient de corrélation : 0.092
    • p-value : 0.629
  • Conclusion: L'hypothèse H2 n'est pas confirmée. Les compétences numériques ne montrent pas de corrélation significative avec le désistement.

Hypothèse H3

  • Hypothèse: Les étudiants qui perçoivent le module comme difficile s’en désintéressent davantage.
  • Test t:
    • t-statistique : 0.167
    • p-value : 0.869
  • Conclusion: L'hypothèse H3 n'est pas confirmée. La perception de la difficulté n'a pas d'effet significatif sur le désistement.

Hypothèse H4

  • Hypothèse: Les étudiants n’ayant pas installé Unity évitent le module Game Design.
  • Test du Khi²:
    • Statistique du Khi² : 0.18
    • p-value : 0.676
    • Degrés de liberté : 1
  • Conclusion: L'hypothèse H4 n'est pas confirmée. L'installation de Unity n'a pas d'effet significatif sur le désistement.

Ces résultats montrent que, selon les données disponibles, aucune des hypothèses n'est confirmée par les tests statistiques effectués. Si vous avez besoin d'une analyse plus approfondie ou de tests supplémentaires, n'hésitez pas à demander !

Pour H1 pourqoui on a choisi ses donnees dans le tableau (Hypothèse H1

Hypothèse: Le taux de désistement est significativement plus élevé dans le parcours ISEFC que dans le parcours IPST.
Test du Khi²:
Statistique du Khi² : 2.17
p-value : 0.14
Degrés de liberté : 1
Conclusion: L'hypothèse H1 n'est pas confirmée. Il n'y a pas de différence significative entre les parcours ISEFC et IPST en termes de désistement.)
Pour l'hypothèse H1, nous avons utilisé un test du Khi² pour évaluer l'indépendance entre deux variables catégorielles : le parcours (Parcours) et le choix de module (choix_module), qui indique le désistement.

Raisonnement pour le Choix des Données

  • Variable Parcours: Cette variable catégorielle indique le type de parcours suivi par les étudiants, soit ISEFC, soit IPST.
  • Variable choix_module: Cette variable binaire indique si un étudiant a choisi de se désister (0) ou non (1).

Pourquoi le Test du Khi² ?

  • Le test du Khi² est approprié pour tester l'indépendance entre deux variables catégorielles.
  • Il nous permet de vérifier s'il existe une association significative entre le type de parcours et le taux de désistement.

Résultats

  • Statistique du Khi²: 2.17
  • p-value: 0.14
  • Degrés de liberté: 1

Conclusion

  • La p-value de 0.14 est supérieure au seuil de signification communément utilisé (0.05), ce qui indique que nous ne pouvons pas rejeter l'hypothèse nulle d'indépendance.
  • Par conséquent, il n'y a pas de preuve statistiquement significative pour suggérer que le taux de désistement diffère entre les parcours ISEFC et IPST.
Si vous avez d'autres questions ou avez besoin de clarifications supplémentaires, n'hésitez pas à demander !

pour chaque hypothese et ses resultats des test fait une redaction descriptive ( ajoute h0)

Rédaction Descriptive des Hypothèses et Résultats

Hypothèse H1

  • Hypothèse Nulle (H0): Il n'y a pas de différence significative dans le taux de désistement entre les parcours ISEFC et IPST.
  • Hypothèse Alternative (H1): Le taux de désistement est significativement plus élevé dans le parcours ISEFC que dans le parcours IPST.
  • Test Utilisé: Test du Khi² pour l'indépendance.
  • Résultats:
    • Statistique du Khi² : 2.17
    • p-value : 0.14
    • Degrés de liberté : 1
  • Conclusion: Avec une p-value de 0.14, nous ne pouvons pas rejeter l'hypothèse nulle. Il n'y a pas de différence significative entre les parcours ISEFC et IPST en termes de désistement.

Hypothèse H2

  • Hypothèse Nulle (H0): Les compétences numériques des étudiants ne sont pas associées au désistement.
  • Hypothèse Alternative (H1): Les étudiants avec de faibles compétences numériques sont plus susceptibles de se désister.
  • Tests Utilisés:
    • Test de normalité (Shapiro-Wilk) pour vérifier la distribution de compet_num.
    • Corrélation de Spearman pour évaluer l'association entre compet_num et choix_module.
  • Résultats:
    • Normalité (Shapiro-Wilk) :
      • Groupe désistement : p-value = 0.021
      • Groupe non-désistement : p-value = 0.005
    • Corrélation de Spearman :
      • Coefficient : 0.092
      • p-value : 0.629
  • Conclusion: Les tests de normalité indiquent que compet_num n'est pas normalement distribué. La corrélation de Spearman montre qu'il n'y a pas d'association significative entre les compétences numériques et le désistement.

Hypothèse H3

  • Hypothèse Nulle (H0): La perception de la difficulté du module n'affecte pas le désistement.
  • Hypothèse Alternative (H1): Les étudiants qui perçoivent le module comme difficile s’en désintéressent davantage.
  • Test Utilisé: Test t pour comparer les moyennes de perception_difficulte entre les groupes de désistement et de non-désistement.
  • Résultats:
    • t-statistique : 0.167
    • p-value : 0.869
  • Conclusion: Avec une p-value de 0.869, nous ne pouvons pas rejeter l'hypothèse nulle. La perception de la difficulté n'a pas d'effet significatif sur le désistement.

Hypothèse H4

  • Hypothèse Nulle (H0): L'installation de Unity n'est pas associée au désistement.
  • Hypothèse Alternative (H1): Les étudiants n’ayant pas installé Unity évitent le module Game Design.
  • Test Utilisé: Test du Khi² pour l'indépendance.
  • Résultats:
    • Statistique du Khi² : 0.18
    • p-value : 0.676
    • Degrés de liberté : 1
  • Conclusion: Avec une p-value de 0.676, nous ne pouvons pas rejeter l'hypothèse nulle. L'installation de Unity n'a pas d'effet significatif sur le désistement.

Ces rédactions fournissent une vue d'ensemble des hypothèses testées, des méthodes utilisées, et des conclusions tirées des résultats statistiques. Si vous avez besoin de plus d'informations ou d'une analyse plus approfondie, n'hésitez pas à demander !

c bien ajoute aussi l analyse des h0 de tests de normalité pour chaque hypothese

Analyse des Hypothèses Nulle pour les Tests de Normalité

Hypothèse H2 - Test de Normalité (Shapiro-Wilk)

  • Hypothèse Nulle (H0) pour le Test de Normalité: Les données de compet_num suivent une distribution normale.
  • Résultats:
    • Groupe désistement :
      • Statistique : 0.87
      • p-value : 0.021
    • Groupe non-désistement :
      • Statistique : 0.79
      • p-value : 0.005
  • Conclusion: Pour les deux groupes, les p-values sont inférieures au seuil de 0.05, ce qui signifie que nous rejetons l'hypothèse nulle. Les données de compet_num ne suivent pas une distribution normale dans les deux groupes.

Cette analyse des hypothèses nulles pour les tests de normalité montre que les compétences numériques ne sont pas normalement distribuées dans les groupes de désistement et de non-désistement. Cela justifie l'utilisation de la corrélation de Spearman pour évaluer l'association entre compet_num et choix_module. Si vous avez d'autres questions ou avez besoin de clarifications supplémentaires, n'hésitez pas à demander !

pourqoui on a choisi de faire test t pour hypothese H3 ? est ce que la distrubition est normale ? sinon si elle est pas normale fait test de mann whitney

It seems that the variable dropout_group is not defined in the current context. This variable was likely defined in a previous cell where the data was split into dropout and non-dropout groups based on the choix_module column.
To proceed, we need to redefine these groups using the loaded DataFrame df. Let's redefine these groups and then perform the Shapiro-Wilk test for normality on the perception_difficulte column for both groups.

Analyse de la Normalité pour l'Hypothèse H3

Pour l'hypothèse H3, nous avons initialement choisi d'utiliser un test t pour comparer les moyennes de perception_difficulte entre les groupes de désistement et de non-désistement. Cependant, pour que le test t soit valide, les données doivent être normalement distribuées.

Résultats du Test de Normalité (Shapiro-Wilk)

  • Groupe Désistement:
    • Statistique : 0.887
    • p-value : 0.042
  • Groupe Non-Désistement:
    • Statistique : 0.854
    • p-value : 0.032

Conclusion

  • Les p-values pour les deux groupes sont inférieures au seuil de 0.05, ce qui signifie que nous rejetons l'hypothèse nulle de normalité. Les données de perception_difficulte ne suivent pas une distribution normale dans les deux groupes.

Test de Mann-Whitney

Étant donné que les données ne sont pas normalement distribuées, nous devrions utiliser le test de Mann-Whitney, qui est une alternative non paramétrique au test t pour comparer les distributions de deux groupes indépendants.
Je vais maintenant effectuer le test de Mann-Whitney pour perception_difficulte.

Résultats du Test de Mann-Whitney pour l'Hypothèse H3

Hypothèse H3

  • Hypothèse Nulle (H0): La distribution de la perception de la difficulté du module est la même pour les étudiants qui se désistent et ceux qui ne se désistent pas.
  • Hypothèse Alternative (H1): La distribution de la perception de la difficulté du module diffère entre les étudiants qui se désistent et ceux qui ne se désistent pas.

Résultats du Test de Mann-Whitney

  • Statistique U: 116.5
  • p-value: 0.813

Conclusion

  • Avec une p-value de 0.813, nous ne pouvons pas rejeter l'hypothèse nulle. Cela signifie qu'il n'y a pas de différence significative dans la perception de la difficulté du module entre les étudiants qui se désistent et ceux qui ne se désistent pas.

Si vous avez d'autres questions ou avez besoin de clarifications supplémentaires, n'hésitez pas à demander !

refaire le travail (the variable dropout_group is groupe 1= 0 and groupe 2 = 1)

refaire le travail (the variable dropout_group is groupe 1= 0 and groupe 2 = 1)

Get started with Vizly