Système d’enregistrement (SOR)

Un système d’enregistrement (SOR) est un SSII (système de stockage et d’extraction de l’information) qui fait autorité pour un élément de données particulier dans un système contenant plusieurs sources du même élément. L’intégrité des données ne peut être garantie qu’en ayant un seul système d’enregistrement pour chaque élément d’information. Des différences subtiles peuvent parfois se … Lire la suite

Apache Parquet

Apache Parquet, un système de stockage orienté colonne pour Hadoop est disponible. Hadoop est un cadre de programmation libre, basé sur Java, qui prend en charge le traitement de grands ensembles de données dans un environnement informatique distribué. Parquet est optimisé pour travailler avec des données complexes en masse et comprend des méthodes pour une … Lire la suite

Data shadow

Les data shadows sont l’ensemble des données générées automatiquement et stockées au cours de notre vie quotidienne. Elles peuvent être créées intentionnellement ou involontairement. Les capteurs et la surveillance IP en sont autant de sources. Elles comprennent également les métadonnées des communications et du mécanisme de sécurité et d’authentification. L’ombre est un synonyme de suivi … Lire la suite

Données historiques

Les données historiques, dans un contexte large, sont des données collectées sur des événements et des circonstances passés se rapportant à un sujet particulier. Par définition, les données historiques comprennent la plupart des données générées manuellement ou automatiquement dans une entreprise. Les sources, parmi un grand nombre de possibilités, comprennent les communiqués de presse, les … Lire la suite

Data Transfer Project (DTP)

Data Transfer Project (DTP) est une initiative open source visant à faciliter les transferts de données en masse contrôlés par les clients entre deux services en ligne. Le projet est un effort de collaboration émergent mené par Facebook, Twitter, Apple, Google et Microsoft. 3. Dans le jargon technique, ____________ désigne le transfert de données à … Lire la suite

Machine à vecteurs de support (SVM)

Une machine à vecteurs de support (SVM) est un type d’algorithme d’apprentissage profond qui effectue un apprentissage supervisé pour la classification ou la régression de groupes de données. Les systèmes d’apprentissage supervisé sont utilisés en apprentissage automatique et en IA. Ils fournissent des données d’entrée et des données de sortie. Celles-ci sont ensuite étiquetées pour … Lire la suite

Citoyen des données

Un employé est un citoyen des données s’il a accès aux informations confidentielles de l’entreprise. L’utilisation du terme « citoyen », vise à souligner le fait que les employés ont des responsabilités en plus de leur droit aux données de l’entreprise. Les citoyens des États-Unis ont le droit de se réunir, mais ils doivent également obéir à … Lire la suite

Actif informationnel

L’actif informationnel désigne un ensemble de connaissances organisées en une seule entité. Comme tout autre actif d’entreprise, les actifs informationnels d’une organisation ont une valeur financière. Le nombre d’individus qui ont accès à cette information augmente la valeur de l’actif. L’information peut être soumise à un cycle de vie très court ; elle est donc … Lire la suite

Golden record

Un « golden record » est une version unique et non ambiguë de chaque entité de données dans l’écosystème d’une organisation. Dans ce contexte, un disque d’or peut également être appelé « la version unique de la vérité ». La vérité est l’information à laquelle tous les utilisateurs de données ont accès lorsqu’ils recherchent la bonne version. Un disque … Lire la suite

Cycle de vie des données

Les cycles de vie des données sont les étapes par lesquelles passe une unité de données depuis le moment où elle est créée ou capturée jusqu’au moment où elle est archivée et/ou supprimée à son terme. Même si les détails peuvent varier d’un expert à l’autre, il existe six étapes auxquelles les professionnels de la … Lire la suite