quickml: le aa pour les développeurs sql · 2019-11-15 · intro à quickml quick ml demo...
TRANSCRIPT
Outline
QuickML: Le AA pour les développeurs SQL
Quick intro à ML
Intro à QuickML
Quick ML Demo
Stratégie IA InterSystems
Emballage
8 | © InterSystems Corporation. All rights reserved. |
Introduction rapide à ML
Programmation Traditionnelle Apprentissage Automatique
ComputerData
ProgramOutput Computer
Data
OutputProgram
10 | © InterSystems Corporation. All rights reserved. |
Le Processus Apprentissage Automatique
Le Sciences des Données nécessitent la compréhension des données, du problème métier et des techniques AA• Langues et outils spécialisés• Itératif par défaut, avec beaucoup d’essai et d’erreur
Les algorithmes AA n’entrent que dans l’étape d’entraînement• Nécessitent beaucoup de ressources de calcul
Préparation des données
Feature Engineering
Sélection de modèle
Entraînementdes modèles
Réglage des paramètres
Déploiementdes modèles
Acquisition des données
Les défis pour les Développeurs d’Applications
• Demande accrue d'IA et de modèles prédictifs
• Courbe d'apprentissage abrupte pour AA
• Opérationnalisation des modèles AA
12 | © InterSystems Corporation. All rights reserved. |
Préparation des données
Feature Engineering
Sélection de modèle
Entraînementdes modèles
Réglage des paramètres
Déploiementdes modèles
Acquisition des données
Automatiser Le Processus d’Apprentissage Automatique
Pourrait-on tester tous les options parmi lesquelles le scientifique données choisirait?• Faisons suppositions éclairées afin de limiter les options• Ajoutons plus de ressources de calcul
Choisir parmi les modèles candidats en fonction des métriques prédéfinie• Optimisons pour précision ou vitesse (runtime)
AutoML
Les défis pour lesDéveloppeurs d’Applications
• Demande accrue d'IA et de modèles prédictifs
• Courbe d'apprentissage abrupte pour AA
• Opérationnalisation des modèles AA
15 | © InterSystems Corporation. All rights reserved. |
QuickML | Panorama
Environnement tout-SQL• Ni besoin d’apprendre les méthodes ou produits AA• Fonctions DDL et requêtes simples
Outil clé en main - AutoML• Feature Engineering et sélection des modèles inclus• Interface unique pour plusieurs « fournisseurs » AutoML
Opérationnalisation facile• Interface universelle pour invoquer les modèles
16 | © InterSystems Corporation. All rights reserved. |
QuickML | Fournisseurs AutoML
Fournisseurs AutoML prennent soin de • Feature Engineering imputation nulls, one-hot-encoding, transformations dates, …• Sélection des modèles en fonction des champs cible et source• Entrainement des modèles algorithmes AA effectifs• Réglage des paramètres play – rinse - repeat
QuickML emballera plusieurs engins AutoML à choisir• Implémentation InterSystems• Paquets open source• Partenariats technologies• Extensible par infrastructure passerelle
17 | © InterSystems Corporation. All rights reserved. |
QuickML | Concepts
ModelDéfinition du problème
• Champ cible
• Champs sources
Training RunActivité d’entrainement
• Fournisseur AutoML
• Données sources (SQL)
• Statut (en cours / fini)
• Journaux
Trained ModelModèle exécutable
• Fournisseur AutoML
• Infos modèle (type, précision, …)
18 | © InterSystems Corporation. All rights reserved. |
QuickML | Concepts
ModelDéfinition du problème
• Champ cible
• Champs sources
Training RunActivité d’entrainement
• Fournisseur AutoML
• Données sources (SQL)
• Statut (en cours / fini)
• Journaux
Trained ModelModèle exécutable
• Fournisseur AutoML
• Infos modèle (type, précision, …)
**
19 | © InterSystems Corporation. All rights reserved. |
Syntaxe | CREATE MODEL
Définir les modèles comme citoyens première classe en SQL IRIS avec DDL simple
CREATE MODEL PainAlert PREDICTING (IsAnomaly BOOLEAN)FROM EHR.WardPatient USING {"ml-provider": "H2O"}
CREATE capture l’énoncé du problème exprimé par les champs cible et source et ces types de données• Énumérer les champs sources en clause WITH ou sélection d’un tableau avec FROM• Model n’est que des métadonnées, non-exécutable• Registrer les defaults par clause USING Model Training
RunTrained Model
20 | © InterSystems Corporation. All rights reserved. |
Syntaxe | TRAIN MODEL
Générez des modèles exécutables en fournissant des données d’entraînement
TRAIN MODEL PainAlert FROM EHR.WardPatientHistoryWHERE DateAdmitted < ‘07/01/2019’
TRAIN envoi données sélectionnées vers engin AutoML, délégant l’entraînement effectif• Procès AA se passe en arrière-plan, objets Training Run suivent le progrès• Objets Trained Models nouveaux et existantes sont gardé pour scénarios ModelOps
Configuration du procès AA avec clause USING(optionel) Model Training
RunTrained Model
21 | © InterSystems Corporation. All rights reserved. |
Syntaxe | PREDICT()
Utilisez des fonctions SQL simple pour obtenir les prédictions, probabilités et précision
SELECT PREDICT(PainAlert), EpisodeID, PatientIDFROM EHR.WardPatients
Mappage automatique des champs sources aux champs sélecté dans le clause FROM• Affiner mappage des champs par clause WITH• Utilise le Trained Model plus récent / défaut registré pour PainAlert
Opérationnalisation plus simpleModel Training
RunTrained Model
25 | © InterSystems Corporation. All rights reserved. |
Stratégie | Accélérer l’IA
DataOps
Collectionnez, nettoyez et gérez les données à grande vitesse avec la
gouvernance
Entraînement
Intégrez avec des stacks AA & AutoML pour les
experts et non-experts
ModelOps
Déploiement des modèles, intégré dans
des applications mission critique
26 | © InterSystems Corporation. All rights reserved. |
Stratégie | Intégrer IA
Plateforme
Gestion des Données Augmentée améliore
l’efficacité des opérations
Application
Plus d’interfaces et fonctionnalités
intelligentes pour apps InterSystems
Solution
Orchestrer des services cloud IA par IRIS Interopérabilité
Cas d’usage: Transactions Augmentées
Opérationnalisation
Les Scientifiques Données connaissent les outils pour créer des modèles prédictifs précis, mais ces logiciels exotiques ne correspondent pas nécessairement à une environnement de production. En même temps, portabilité n’est pas une excuse pour sacrifier la performance.
Predictive Modelling/ Machine Learning Tools
(Spark, R, Tensorflow, …)
Intégration PMML | Concept
RI SI
Model
PMML
PMML Class
Training Input
Training Output
Event
29 | © InterSystems Corporation. All rights reserved. |
Intégration PMML | Usage
Engagez PMML pour le déploiement des modèles• Scientifiques Données puissent continuer à utiliser leurs outils préférés• APIs simples pour charger et invoquer les modèles PMML• Génération du code ObjectScript optimisée• Registrer directement de SparkML avec extension Spark
import com.intersystems.spark._val training = spark.read.iris("SELECT hasSepsis, f1, f2, f3 FROM Patient")val formula = new RFormula().setFormula("hasSepsis ~ f1 + f2 + f3")val lr = new LogisticRegression().setMaxIter(10).setRegParam(0.001)val pipeline = new Pipeline().setStages(Array(formula, lr))val model = pipeline.fit(training)
import com.intersystems.spark.ml._model.iscSave("Models.SepsisModel", training.schema)
Cas d’usage: Interopérabilité IA
Orchestration
Les expectations pour applications intelligentes incluent exigences qu’on pourrait répondre avec paquets source ouverte, tiers ou cloud. Intégrer une est facile, mais assembler des applications ou flux qui touchent une dizaine bénéficiait significativement d’une plateforme interopérabilité solide.
Défis pour Développeurs d’Applications
• Demande accrue d'IA et de modèles prédictifs
• Courbe d'apprentissage abrupte pour AA
• Opérationnalisation des modèles AA