Contexte des données

Le contexte des données fait référence à l’ensemble des connexions entre les points de données. Ces connexions peuvent être créées en tant que métadonnées ou simplement identifiées et corrélées. Les métadonnées contextuelles apportent de la valeur et rendent possible l’extraction des données. Un seul point de données est insuffisant. Prenez le nombre 42. Il peut … Lire la suite

Coût par impression

Le CPI (coût par impression) est une mesure d’efficacité qui s’applique à la fois à la publicité sur le web et dans les médias imprimés. Le coût par mille (mille) impressions, communément abrégé en CPM, est un terme connexe utilisé par ceux qui traitent de nombreuses annonces dans la publicité imprimée ou sur le Web. … Lire la suite

Analyse descriptive

L’analyse descriptive est une étape préliminaire du traitement des données qui crée un résumé des données historiques afin de produire des informations utiles et éventuellement de préparer les données pour une analyse plus approfondie. Les méthodes d’agrégation et d’exploration des données organisent les données et permettent d’identifier des modèles et des relations qui ne seraient … Lire la suite

Induction mathématique

L’induction mathématique est une forme spéciale de raisonnement déductif qui prouve un fait sur un ensemble infini d’éléments en prenant un nombre fini d’étapes. Pour que l’induction mathématique fonctionne avec un ensemble infini, cet ensemble doit être dénombrable, c’est-à-dire qu’une correspondance biunivoque doit exister entre les éléments de l’ensemble en question et l’ensemble des entiers … Lire la suite

Données firmographiques

Les données firmographiques sont des types d’informations qui peuvent être utilisées pour catégoriser les organisations, comme la zone géographique, le nombre de clients, le type d’organisation, l’industrie, les technologies utilisées, etc. Les données sont utilisées pour segmenter les organisations en catégories significatives. Les désignations de société publique ou privée, d’organisme à but non lucratif ou … Lire la suite

Incidence

L’incidence est une statistique qui mesure la fréquence d’un événement ou le nombre de fois qu’il se produit au sein d’une population. Le taux d’incidence est généralement exprimé sous forme de fraction, par exemple, 48 cas de rougeole sur une population de 750 écoliers au cours d’un hiver. Toutefois, le taux peut également être exprimé … Lire la suite

Raisonnement déductif

Le raisonnement déductif est un processus logique dans lequel une conclusion est basée sur la concordance de plusieurs prémisses qui sont généralement supposées être vraies. Le raisonnement déductif est parfois appelé logique descendante. Le raisonnement déductif repose sur la formulation de prémisses logiques et la formulation d’une conclusion autour de ces prémisses. Le raisonnement déductif … Lire la suite

Coefficient de corrélation

Le coefficient de corrélation est une mesure statistique qui permet d’évaluer dans quelle mesure les changements de la valeur d’une variable permettent de prévoir le changement de la valeur d’une autre variable. Dans les variables positivement corrélées, la valeur augmente ou diminue en tandem. Dans les variables à corrélation négative, la valeur de l’une augmente … Lire la suite

Hypothèse

Dans les contextes scientifiques, une hypothèse est une déclaration intelligible qui décrit la relation de deux ou plusieurs variables. Elle peut également être utilisée pour expliquer un phénomène observé. Dans une expérience ou une étude scientifique, l’hypothèse est un bref résumé de la prédiction du chercheur sur les résultats de l’étude, qui peut être confirmée … Lire la suite

Sur-échantillonnage et sous-échantillonnage

L’exploration et l’analyse de données utilisent le sur-échantillonnage et le sous-échantillonnage pour ajuster des classes de données inégales et créer des ensembles de données équilibrés. Également connu sous le nom de « rééchantillonnage », le suréchantillonnage et le sous-échantillonnage peuvent être utilisés pour modifier les classes de données. Cette analyse des données est souvent plus précise que … Lire la suite