Comment choisir un arbre de décision d`analyse statistique?

<span>
Un arbre de décision est comme un plan de choisir les statistiques appropriées.
Un arbre de décision est comme un plan de choisir les statistiques appropriées. (Image: Singe Business Images Ltd / Valueline / Getty Images)

Une partie de la conception d`un projet de recherche solide est le choix des analyses statistiques. Une façon d`aborder cette tâche est d`utiliser un arbre de décision. Si vous abordez plusieurs questions dans votre projet, vous aurez besoin d`utiliser l`arbre de décision pour chacun d`eux.

Les choses dont vous aurez besoin

  • manuel statistique
  • manuel de conception de la recherche

Préparation

Notez les cinq catégories de questions de recherche: « Description » Tu veux connaître les valeurs typiques pour votre échantillon, comme l`âge moyen de vos patients ou la taille moyenne d`une vendre- « différence » Tu veux savoir si deux ou plusieurs groupes diffèrent sur une ou plusieurs caractéristiques, telles que le type de voiture achetée ou maison de revenus « Association » Tu veux savoir comment les deux variables sont associées, telles que l`éducation et le revenu, ou la douleur perçue et depression- et « Prédiction « Tu veux savoir comment un ou plusieurs facteurs a un impact sur une caractéristique d`intérêt, tels que la prévision viewership TV sur la base de variables- démographique et « Autre ».

Notez les quatre niveaux de mesure. Chaque qualité ou caractéristique mesurée dans un projet de recherche qui est, chaque variable fait usage de l`un des quatre niveaux de mesure, qui, dans l`ordre croissant ou de force, sont nominale, ordinale, d`intervalle et Ratio. Les données concernant décomptes, tels que le nombre de chaque type de film que les cinéphiles voient une nuit romantique donnée par rapport à l`action / aventure, par exemple utiliser le niveau nominal de mesure. Données concernant le classement tels que les préférences ordonnées pour des vacances spot utiliser le niveau ordinal de mesure. Les données concernant le nombre où la différence entre, disons que 25 et 35 implique la même différence d`une certaine qualité entre 55 et 65 telles que la température d`utilisation du niveau d`intervalle de mesure. Les données portant sur le nombre d`une manière comme une échelle d`intervalle, mais avec un vrai zéro comme le nombre d`heures supplémentaires qu`une personne a travaillé à utiliser le niveau de rapport de mesure.

Notez les deux grandes catégories de forme pour une collection ou la distribution des données. Si les données créent une cloche courbe ou distribution « normale », utilisez les statistiques paramétriques. Utiliser des statistiques non paramétriques si les données créent une distribution « non-normale », comme une forme de double chameau bosse, ou un coup comme une antenne parabolique.

Dessiner un arbre de décision d`analyse statistique

Dessiner la première fourche sur l`arbre de décision avec cinq alternatives, en ce qui concerne le type de question de recherche que vous avez: description, la différence, l`Association, la prévision, ou autre. Si une question sortes comme « Autre », vous aurez besoin de parler avec un consultant statistique, donc ne pas tenir compte « autres » à partir d`ici en matière de dessin l`arbre de décision.

Vidéo: Créer un système de paris sportifs sans risques sur Microsoft Excel

Tirer quatre alternatives pour chaque fourchette à l`étape précédente, en dehors de « Autre ». Celles-ci concernent le niveau de mesure de données nominale, ordinale, Intervalle et Ratio. A la fin de cette étape, vous devriez avoir 16 fourches: Description / nominale, Description / ordinal, Description / Intervalle, Description / Ratio, différence / nominal, et ainsi de suite.

Dessinez deux fourchettes pour chaque alternative impliquant ordinal, Intervalle ou données de rapport. Celles-ci impliquent la forme de la distribution, comme décrit dans la préparation Étape 4. Par exemple, la description / nominal n`a pas d`autres fourches, mais Description / ordinal se décompose en Description / ordinale / Parametric et description / ordinale / non Parametric. A la fin de cette étape, vous devriez avoir 28 fourchettes.

Ecrire dans les statistiques qui s`appliquent à chacune des fourches « Description » Final

Ecrire dans les statistiques suivantes pour la description / nominale: fréquence, fréquence relative, le mode. Pour Description / ordinale / Parametric: fréquence, fréquence relative, le mode, la plage. Pour Description / ordinale / non Parametric: fréquence, fréquence relative, médiane, mode, plage.



Ecrire dans les statistiques suivantes pour la description / Intervalle / Parametric: la fréquence, la fréquence relative, moyenne, médiane, mode, plage, écart-type ou la variance. Pour Description / Intervalle / non Parametric: fréquence, fréquence relative, médiane, mode, plage.

Ecrire dans les statistiques suivantes pour la description / Ratio / Parametric: fréquence, fréquence relative, moyenne, médiane, mode, plage, écart-type ou la variance. Pour Description / Rapport / non Parametric: fréquence, fréquence relative, médiane, mode, plage.

Ecrire dans les statistiques qui s`appliquent à chacune des fourchettes « différence » Final

Ecrire dans les statistiques suivantes pour la différence / nominale: Si la comparaison est pour deux échantillons indépendants deux groupes complètement séparés de personnes, disons-le calcul de la statistique du chi carré. Si la comparaison est pour deux associés ou dépendants échantillons dire, deux groupes qui ont été adaptés les uns aux autres, ou deux « groupes » de scores où une personne effectue deux scores de choix, comme un « avant de voir le groupe d`annonces » et un « après avoir vu le groupe d`annonces » -calculate le test McNemar pour l`importance des changements. Si la comparaison est plus de deux échantillons indépendants, calculer la statistique du chi carré. Si la comparaison est plus de deux échantillons dépendants ou associés, calculer le test de Cochran Q.

Ecrire dans les statistiques suivantes pour la différence / ordinale / Parametric ou non Parametric: Si la comparaison est pour deux échantillons indépendants, calculer le test U de Mann-Whitney, le test de Kolmogorov-Smirnov deux échantillons, ou le rang Sums. Si la comparaison est pour deux échantillons apparentés ou à charge, calculer le test du signe, ou les paires appariés Wilcoxon rangs ou un test T. Si la comparaison est plus de deux échantillons indépendants, utiliser l`analyse à sens unique Kruskal-Wallis de la variance ou un test H. Si la comparaison est plus de deux échantillons dépendants ou associés, utilisez Friedman analyse dans les deux sens de la variance ou un test de chi carré.

Ecrire dans les statistiques suivantes pour la différence / Intervalle / Parametric: Calculer Si la comparaison est pour deux échantillons indépendants, calculer les échantillons indépendants t-test. Si la comparaison est pour deux échantillons apparentés ou à charge, calculer test t échantillons dépendants. Si la comparaison est plus de deux échantillons indépendants, utiliser l`analyse inter-sujets de la variance ou ANOVA. Si la comparaison est plus de deux échantillons dépendants ou associés, utilisez les sujets à l`intérieur-ANOVA.

Ecrire dans les statistiques suivantes pour la différence / Intervalle / non Parametric, et la différence / Rapport / non-Parametric: Voir « Différence / ordinale / Parametric ou non Parametric » ci-dessus aussi, essayez le test de randomisation pour paires. Pour la différence / Ratio / Parametric: Voir « Différence / Intervalle / Parametric, » ci-dessus.

Ecrire dans les statistiques qui s`appliquent à chacun des « Association » Final et Forks « de prévision »

Ecrire dans les statistiques suivantes pour Association / nominal: le coefficient d`urgence, C - voir Siegel - ou le coefficient de corrélation phi pour - voir Heiman. Pour Association / ordinale / Parametric et non Parametric: coefficient de corrélation de Spearman, r-sous-s, ou le coefficient de corrélation de rang Kendall, tau.

Ecrire dans la statistique suivante pour l`Association / Intervalle / Parametric: corrélation de Pearson, r. Pour Association / Intervalle / non Parametric: Aucune option disponible.

Ecrire dans la statistique suivante pour l`Association / Rapport / Parametric: la corrélation de Pearson, r. Pour Association / Rapport / non Parametric: Aucune option disponible.

Vidéo: Les 5M ou comment faire un diagramme d`Ishikawa

Ecrire dans la statistique suivante pour la prédiction / nominale: régression multiple pour dépendante nominale variables- voir Pedhazur 1997. Pour toutes les autres branches de prédiction: Effectuer une régression multiple, l`interprétation des données avec beaucoup de prudence dans le cas de données non paramétriques. Si vous utilisez prédicteurs niveau nominal, voir Pedhazur, 1997 ou Aguinis 2004.

Application

Ecrivez chacune de vos questions de recherche. Un projet donné peut avoir plus d`une question. Par exemple, « Combien de chaque vêtements taille pour chaque style de vêtements ne nos magasins vendent? » Ou « Est-il une réelle différence entre les styles ou les quantités de matériaux commandés à New York par rapport à Los Angeles? » - ce qui est vraiment deux questions -ou « Comment est la taille de la tumeur liée à l`âge et le sexe du patient, et la durée du temps écoulé depuis le diagnostic initial? »

Trier votre première question de recherche dans l`une des cinq catégories, la description et ainsi de suite.

Déterminer le niveau de mesure à utiliser pour les données, pour votre première question de recherche. Les niveaux sont nominales, ordinales, Intervalle et Ratio.

Faire une estimation de la forme de la distribution de vos données, pour votre première question de recherche, si elle a des données numériques mesurées sur l`ordinal, l`intervalle ou le niveau de rapport. Cela est, estimer si vos données pour chaque variable sont normale ou non normale dans la distribution.

Suivez l`arbre de décision pour déterminer ce que les statistiques à utiliser pour votre première question de recherche.

Application Répétez les étapes 2 à 5 pour chacune de vos questions de recherche.

Conseils Avertissements

  • Ne hésitez pas à travailler avec un consultant statistique dans la planification ou le calcul des statistiques.
Articles connexes