Table of Content

"L'intelligence artificielle vend, fournit des données!" - par Ankit Rathi

[ad_1]



Contexte

Le monde évolue à un rythme accéléré et de nouvelles technologies font leur apparition pour refaçonner le monde des affaires et de la société. L'une de ces technologies émergentes est l'intelligence artificielle (IA). L'intelligence artificielle a pris de l'ampleur dans le monde, de même que d'autres technologies telles que l'Internet des objets (IoT), la Blockchain, l'impression 3D, la robotique, etc.

L'intelligence artificielle saute partout autour de nous, aussi bien dans les domaines touchant à la science-fiction que les voitures sans conducteur pour les tâches les plus courantes, telles que le programme que je devrais regarder sur Netflix / Amazon. Amnesty International continue d’avoir une influence considérable dans presque tous les domaines de la vie, des affaires à la civilisation.

Avec ces technologies, l’entreprise aura la vigueur nécessaire pour résoudre des problèmes que l’humain ne peut résoudre.

Trois composants de l'IA

Outre le contexte du domaine d'application de l'IA, l'IA comporte trois composants principaux:

Le premier est l'algorithme de l'IA lui-même. Les bibliothèques d’apprentissage machine open source telles que Keras, Theano et TensorFlow ont permis d’éliminer une grande partie de la complexité de bas niveau impliquée dans la conception et la construction d’applications d’intelligence artificielle. Ces outils sont gratuits, bien documentés et appuyés par des communautés dynamiques. La disponibilité de ces outils a rendu la construction d'applications IA beaucoup plus accessible aux développeurs.

Le second est la puissance de calcul, à la fois sous forme de puissance de calcul brute et de solutions de stockage de données à grande échelle. Les services cloud tels que Amazon Web Services, Google Cloud, Microsoft Azure et autres simplifient la location de serveurs, de machines virtuelles et d’outils Big Data en appuyant simplement sur quelques boutons.

Le troisième mais le plus important sont les données. Avant de pouvoir envisager d'embaucher des scientifiques de données, de louer ou de payer des serveurs et d'installer des bibliothèques d'apprentissage machine à code source libre, vous devez disposer de données. La qualité et la profondeur des données détermineront le niveau d'applications IA que vous pouvez atteindre.

Données et IA

Alors que l'IA est un domaine d'étude assez vaste en informatique, l'enthousiasme de nos jours est centré sur un domaine de l'IA appelé apprentissage automatique et, en particulier, apprentissage en profondeur . L'apprentissage automatique forme des algorithmes pour apprendre et prévoir les réponses aux problèmes en analysant les données afin de faire des prévisions par eux-mêmes.

Comme nous en avons discuté plus tôt, la promesse de l'IA dépend de certains ingrédients pour une adoption réussie; L'un des ingrédients essentiels d'une implémentation réussie de l'IA est une grande quantité de données historiques propres et représentatives.

Cependant, à moins que Google ou Facebook ne contiennent de grandes quantités de données représentatives, vous aurez des difficultés à collecter des données historiques suffisantes pour donner la déduction requise pour que les techniques d'apprentissage automatique facilitent efficacement les initiatives d'IA. .

Par conséquent, pour que l'IA fonctionne, il est nécessaire d'améliorer le niveau de préparation, d'ingénierie, d'enrichissement et de contextualisation des données.

Comme pour la plupart des rapports sur les technologies innovantes, cette discussion est bien en avance sur les pratiques actuelles de l'industrie. La vision a un but utile en suggérant ce qui est possible.

Mais avec de nombreuses entreprises dépourvues de l'infrastructure de données nécessaire pour obtenir de véritables capacités en IA et ML, le cheminement vers une production parfaite peut aussi être si abstrait qu'il en déconcerte les gens.

Les algorithmes d'intelligence artificielle tirent des enseignements des données. Il est essentiel que vous fournissiez les données correctes pour le problème que vous souhaitez résoudre. Même si vous disposez de bonnes données, vous devez vous assurer que leur échelle, leur format et même leurs fonctionnalités utiles sont inclus.

Comprenez les fonctionnalités clés dont vous avez besoin pour les pipelines collaboratifs de préparation de données opérationnelles afin de répondre aux besoins de vos analystes de données et de vos données.

Lors du lancement mondial du livre Outside Insight, l’auteur et PDG de Meltwater, Jorn Lyseggen, ainsi que des experts en intelligence artificielle, ont discuté de l’importance des données qui alimentent l’intelligence artificielle et de la nécessité pour les dirigeants d’utiliser les résultats de intelligence artificielle pour la prise de décision, à la fois pour comprendre les données qui alimentent ces sorties et pour s’assurer qu’elles sont aussi complètes et impartiales que possible.

«L'intelligence artificielle est votre fusée, mais les données sont le carburant. Vous pouvez avoir les meilleurs algorithmes au monde, une fusée incroyable, mais vous n'irez que dans la mesure où vos données vous emmènent. Les données sont fondamentales, les données sont AI », a déclaré Gerardo Salandra, président de Hong Kong AI Society et PDG de Rocketbots, lors de la cérémonie de lancement à Hong Kong.

De même, la hiérarchie des besoins La science des données de Monica Rogati est une pyramide qui montre ce qui est nécessaire pour ajouter de l'intelligence au système de production. En bas, il est nécessaire de rassembler les bonnes données, dans les bons formats et systèmes, et dans la bonne quantité. 19659010] Toute application d'IA et de ML dépend uniquement de la qualité des données collectées.

Sur le marché en croissance de l'IA, International Data Corporation (IDC) prédit que les dépenses mondiales devraient augmenter de 50% par an. , avec un total de 57,6 milliards de dollars d’ici 2021. Les chefs d’entreprise reconnaissent l’importance de la mise en œuvre d’une stratégie de lutte contre la grippe aviaire dans le monde entier.

Cependant, il ne suffit pas d’introduire des outils s pour AI; Vous avez besoin des entrées de données correctes pour trouver des informations précieuses.

Importance des données

On a récemment beaucoup écrit sur l'IA, mais un élément qui ne se distingue souvent pas est la valeur que jouent les données pour permettre à l'IA de fonctionner. Prenez les voitures sans conducteur, probablement l’application d’IA la plus reconnue. La construction d'une voiture autonome nécessite une énorme quantité de données allant des signaux de capteurs infrarouges aux images d'appareils photo numériques et aux cartes à haute résolution.

NVIDIA estime qu'une voiture autonome génère 1 To par heure de données brutes. Toutes ces données sont ensuite utilisées dans le développement des modèles d'intelligence artificielle qui pilotent réellement la voiture.

Bien que nous ayons constaté des progrès récents dans d'autres techniques d'IA, telles que l'apprentissage par renforcement, qui utilisent moins de données (comme le succès du récent Deep Mind Alpha Go), Zero dans le jeu GO), les données restent cruciales pour la résolution. Développement d'applications IA.

Les entreprises sont submergées par les systèmes informatiques silos construits au fil des années et contenant des données conçues pour effectuer des tâches individuelles très spécifiques du système "Enregistrement", mais malheureusement, ces enregistrements sont dupliqués en plusieurs fois. Les systèmes d’enregistrement, qui entraînent une prolifération massive de données, mais ne disposent pas de la représentation complète d’une entité dans un seul système.

Cette réalité a abouti à un paysage de données fragmenté et souvent dupliqué, qui nécessite des moyens coûteux et souvent inefficaces pour établir des ensembles de données "Source of Truth".

Les données fournissent "l'intelligence" à l'IA

Les applications d'intelligence artificielle s'améliorent à mesure qu'elles acquièrent plus d'expérience (signifie plus de données), mais les applications d'IA actuelles ont le béguin malsain pour obtenir cette expérience exclusivement. des techniques d'apprentissage automatique. Bien qu'il n'y ait rien de intrinsèquement erroné dans Machine Learning, l'avertissement principal pour un résultat réussi de Machine Learning est constitué de données historiques suffisantes et représentatives que la machine peut apprendre.

Par exemple, si un modèle d'IA apprend à reconnaître des chaises et n'a vu que des chaises de salle à manger standard dotées de quatre pieds, le modèle peut croire que les chaises ne sont définies que par quatre pieds.

Cela signifie que s'il est démontré que le modèle est, par exemple, une chaise de bureau avec un pilier, il ne le reconnaîtra pas comme une chaise.

Préparation des données pour AI

Même si votre organisation n'est peut-être pas au stade où vous pouvez commencer à créer des applications d'intelligence artificielle, vous devez au moins vous préparer à un avenir dans lequel vos données seront utilisées. conduire des solutions intelligentes.

Traitez chaque nouvelle initiative ou projet comme une occasion de jeter les bases de futurs modèles de données.

Collecte de données

Cet aspect est devenu crucial à la lumière de la législation du GDPR. Existe-t-il des directives claires et suivies sur quoi et pourquoi les données sont collectées lors du développement d'une nouvelle fonctionnalité ou d'un nouveau produit?

Les données ont-elles un but ou sont-elles collectées de la sorte?

Format de données

Lorsque les données sont collectées, sont-elles stockées dans un format utilisable dans toutes nos données? points de contact de la collection? Les noms des champs sont-ils les mêmes? Le même niveau de validation et de vérification des erreurs s'applique-t-il à tous les produits?

Stockage de données

Les données doivent être transférées dans les magasins de données et être disponibles en temps réel pour tous les secteurs de l'entreprise. Étant donné que les applications d'intelligence artificielle deviennent généralement plus fiables, plus elles sont en mesure de mettre en corrélation différentes sources d'informations, des ensembles de données isolés difficiles d'accès deviennent un obstacle à la découverte de la valeur des données d'une organisation.

Connaissance des données

L'IA est fondamentalement biaisée dans la manière dont elle a été créée, formée et programmée. Pour que AI réussisse, il est essentiel que les responsables et les décideurs maîtrisent les données, y remettent en question le modèle, le modèlent et comprennent parfaitement les hypothèses sous-jacentes afin de garantir le bon fonctionnement du modèle. La réponse fournie correspond en réalité au terrain sur lequel vous souhaitez évoluer.

Pour obtenir les meilleurs modèles prédictifs et les meilleures perspectives, il est essentiel que les données qui les informent proviennent de diverses sources externes.

Plus de données

Comme chez l'homme, les applications d'intelligence artificielle s'améliorent avec plus d'expérience. Les données fournissent des exemples essentiels de modèles d’entraînement pouvant faire des prévisions et des classifications. Un bon exemple de ceci est la reconnaissance d'image. La disponibilité des données via ImageNet a transformé le rythme de changement dans la compréhension des images et conduit les ordinateurs à atteindre la performance humaine. En règle générale, vous avez besoin de 10 fois plus de données que le nombre de paramètres (c'est-à-dire les degrés de liberté) dans le modèle en cours de construction.

Plus la tâche est compliquée, plus il faut de données.

Comprendre les données

Pour cuisiner le repas parfait, il est bon de connaître les goûts de vos convives. De même, les données sont essentielles pour adapter un modèle d'intelligence artificielle aux besoins d'utilisateurs spécifiques. Nous devons savoir comment les utilisateurs utilisent leurs applications et rechercher du contenu pour générer des recommandations personnalisées significatives.

En sachant ce que les utilisateurs lisent, téléchargent et collectent, nous pouvons vous donner des conseils sur les contenus potentiellement intéressants. En outre, des techniques telles que le filtrage collaboratif, qui font des suggestions basées sur la similarité entre les utilisateurs, s’améliorent avec l’accès à plus de données; Plus vous disposez de données utilisateur, plus l'algorithme est susceptible de trouver un utilisateur similaire.

Diverses données

Un problème clé dans la construction de modèles d'intelligence artificielle est la sur-adaptation, c'est-à-dire lorsque le modèle se concentre trop spécifiquement sur les exemples donnés. Par exemple, si un modèle essaie d'apprendre à reconnaître les chaises et que seules les chaises de salle à manger standard à quatre pieds ont été montrées, vous pouvez apprendre que les chaises sont définies comme ayant quatre pieds. Si le modèle est montré une chaise de bureau avec un seul pilier, je ne le reconnaîtrais pas.

Le fait de disposer de diverses données permet de lutter contre ce problème.

Pendant l'entraînement, le modèle d'intelligence artificielle peut voir plus d'exemples de différents types d'objets. Cela est particulièrement utile lorsque vous travaillez avec des données sur des personnes, où il peut exister un biais algorithmique potentiel à l'encontre de personnes d'origines diverses. La professeure Dame Wendy Hall a fait cette remarque dans son entretien au Sommet mondial d'Amnesty International. Le professeur Hall a insisté sur la nécessité de veiller à ce qu'IA soit formée à divers ensembles de données.

Un bon exemple de la façon de lutter contre cela par le biais de données est ce qu'Apple a fait pour former son nouvel algorithme de reconnaissance d'identifiant de visage.

Données externes

Alors que la course à la mise en œuvre des outils d'intelligence artificielle au niveau commercial atteint de nouveaux sommets, il est important de garder à l'esprit que les données qui informent ces outils sont d'une importance primordiale. Se fier uniquement aux informations internes pour informer les algorithmes produira des informations obtenues uniquement à partir des informations que vous possédez déjà.

Il est en revanche essentiel que les décideurs recherchent également des informations à partir de données externes pour obtenir une vision beaucoup plus complète et impartiale de leurs clients et du paysage du secteur.

Tests d'hypothèses

Même dans les cas où des techniques nécessitant moins de données d'apprentissage peuvent être utilisées, davantage de données facilitent le test des systèmes d'intelligence artificielle. Le test A / B en est un exemple: un développeur absorbe une petite quantité de trafic sur un site et vérifie si un nouveau moteur de recommandation ou un nouvel algorithme de recherche fonctionne mieux dans ce petit groupe de trafic.

Plus le trafic est important (données moyennes), plus il est facile de tester plusieurs algorithmes ou variantes. Lors du Sommet AI World, Netflix a expliqué comment ils utilisent les tests A / B pour sélectionner des œuvres d’art optimisant l’engagement avec les films et les séries télévisées de Netflix.

Réutilisation des données

Enfin, il est généralement vrai que les données peuvent être réutilisées pour différentes applications. Par exemple, une technique appelée apprentissage par transfert permet aux données développées pour un domaine d'être appliquées à un autre domaine. De plus, des travaux récents ont révélé que les connaissances antérieures peuvent améliorer encore davantage de tâches telles que la détection d'objets dans des images.

Les travaux récents de Google ont montré comment la formation utilisant des données désignées pour une tâche différente, telle que la reconnaissance d'image, peut améliorer les performances dans une tâche complètement différente, telle que la traduction de langue.

Conclusion

En résumé, les données sont l'élément fondamental du développement de tout système d'IA aujourd'hui.

Dans un proche avenir, ce que nous appelons maintenant l'IA sera intégré à notre culture et nous ne l'appellerons plus l'IA. Ce ne sera que comment les choses fonctionnent. Ce que vous avez sous votre contrôle aujourd'hui, ce sont vos données. Il est essentiel que vous commenciez à vous préparer à un avenir dans lequel les applications d'intelligence artificielle pourront commencer à utiliser vos données et qui commence par la quantité et la qualité des données elles-mêmes.

Adopter l'intelligence artificielle dans le monde des affaires et dans la société est un voyage, pas une solution miracle, qui résoudra les problèmes instantanément. Cela commence par la collecte de données sous forme de visualisations simples et de processus statistiques vous permettant de mieux comprendre vos données et de contrôler vos processus.

À partir de là, il utilisera des capacités analytiques de plus en plus perfectionnées pour atteindre cet objectif utopique de production parfaite, où il pourra compter sur l'IA pour l'aider à fabriquer des produits de la manière la plus efficace et fiable possible.

Ankit Rathi est un architecte d’IA, un auteur publié et un orateur bien connu. Son intérêt réside principalement dans la création d'applications / produits d'intelligence artificielle du début à la fin, en respectant les meilleures pratiques d'ingénierie et d'architecture de données.













[ad_2]

Post a Comment