Une autre contribution intéressante au modèle de régression de séries chronologiques peut être une inclusion du modèle autorégressif pour les erreurs corrélées en série. Regardons ça. Les plus grandes surprises de ce test sont les performances de SVM et le modèle linéaire logit. Le modèle de logit linéaire fonctionne étonnamment bien étant donné que la plus forte variable dans le modèle (N_OPEN_REV_ACTS) n`est pas linéairement corrélée avec les cotes de log de succès (PURCHASE). La raison pourrait être que, si cette relation n`est pas linéaire, elle est monotone. En outre, l`AUROC est basé sur la probabilité estimée, qui n`est en effet pas linéaire dans les variables prédictives en raison de la transformation sigmoïde ((1 + exp (-nu)) ^ {-1} ). SVM d`autre part, fonctionne étonnamment mal. Cependant, il convient de mentionner que l`auteur de ce post a très peu d`expérience avec SVM, qui pourrait être un désavantage pour SVM. En outre, la conversion Pratt de la classification SVM aux probabilités pourrait jouer un rôle ici. par exemple.

Ces modèles devraient être mis en place en utilisant les termes TI dans la formule du modèle. Par exemple: y ~ TI (x) + TI (z) + TI (x, z), ou y ~ TI (x) + TI (z) + TI (v) + TI (x, z) + TI (x, v) + TI (z, v) + TI (x, z, v). Les termes TI produisent des interactions avec les effets principaux des composants exclus de manière appropriée. (Il n`est en fait pas nécessaire d`utiliser les termes TI pour les principaux effets ici, les termes s pourraient également être utilisés.) GAM permet l`imbrication (ou «chevauchement») de te et s lisse, et génère automatiquement des conditions latérales pour rendre ces modèles identifiables, mais les modèles résultants sont beaucoup moins stables et interprétables que ceux construits en utilisant des termes de TI. En regardant l`intrigue ou le résumé (lm_y), vous pourriez penser que le modèle s`adapte bien, mais regardez la parcelle résiduelle-EEK! Il a été démontré que les versions naïves de l`AIC conditionnel étaient beaucoup trop susceptibles de sélectionner des modèles plus grands dans certaines circonstances, une difficulté attribuable à la négligence de l`incertitude des paramètres de lissage lors du calcul des degrés de liberté effectifs [26], cependant corriger les degrés de liberté effectifs pour ce problème restaure des performances raisonnables. Le premier est la fonction GAM. Check, qui fait quatre parcelles: QQ-parcelle de résidus, prédicteur linéaire par rapport aux résidus, l`histogramme des résidus et le tracé des valeurs ajustées par rapport à la réponse. Faisons-les pour les modèles gam_4 et gam_6. L`idée clé ici est que la dépendance de la réponse sur les prédicteurs peut être représentée comme un sous-modèle paramétrique plus la somme de certains (fonctionnals de) fonctions lisses d`une ou plusieurs des variables prédictitrices. Ainsi, le modèle est assez flexible par rapport aux modèles linéaires linéaires ou généralisés strictement paramétriques, mais a encore beaucoup plus de structure que le modèle complètement général qui dit que la réponse est juste une fonction lisse de tous les covariables. Comme indiqué précédemment, une partie importante de cet exercice de modélisation consiste à examiner les relations partielles entre la variable dépendante binaire (PURCHASE) et les prédicteurs. Les modèles GAM où les paramètres de lissage ont été automatiquement sélectionnés avec REML fonctionnent mieux que le modèle où nous avons utilisé un paramètre de lissage plat de 0,6 à travers toutes les variables (ce qui tend à fonctionner bien pour la plupart des modèles).

Toutefois, dans cet exemple, les modèles avec sélection automatique tendent également à produire des fonctions plus Wiggly que le modèle avec (lambda = 0.6 ) sur toutes les variables. Pour un modèle de ciblage, le wiggliness supplémentaire ne vaut pas la perte de l`intuition modèle. Notez un point important. Pour que le modèle soit identifiable, les fonctions lisses doivent généralement être contraintes pour avoir une moyenne nulle (généralement prise sur l`ensemble des valeurs covariées). La contrainte est nécessaire si le terme impliquant le lissage inclut une fonction constante dans sa portée. GAM applique toujours de telles contraintes à moins qu`il y ait une variable présente, auquel cas une évaluation est faite de la nécessité ou non de la contrainte (voir ci-dessous).