Modèle additif statistique

Posted on Posted in Uncategorized

Examinons un exemple spécifique des modèles additifs généralisés: une généralisation du modèle logistique (logit) pour les valeurs variables dépendantes binaires. Comme décrit en détail dans le contexte de l`estimation non linéaire et des modèles linéaires/non linéaires généralisés, le modèle de régression logistique pour les réponses binaires peut être écrit comme suit: dans les statistiques, un modèle d`additif généralisé (GAM) est une méthode linéaire généralisée modèle dans lequel le prédicteur linéaire dépend linéairement des fonctions lisses inconnues de certaines variables prédictitrices, et l`intérêt se concentre sur l`inférence sur ces fonctions lisses. Les GAMs ont été initialement développés par Trevor Hastie et Robert Tibshirani [1] pour mélanger les propriétés des modèles linéaires généralisés avec des modèles additifs. Un exemple d`application de ce modèle peut être trouvé dans Hastie et Tibshirani (1990). Nous pouvons combiner la notion de modèles additifs avec des modèles linéaires généralisés, pour dériver la notion de modèles additifs généralisés, comme: une autre question à garder à l`esprit concerne l`interprétabilité des résultats obtenus à partir de modèles linéaires (généralisés) vs. modèles additifs généralisés. Les modèles linéaires sont facilement compris, résumés et communiqués à d`autres (par exemple, dans les rapports techniques). En outre, les estimations de paramètres peuvent être utilisées pour prédire ou classer les nouveaux cas d`une manière simple et directe. Les modèles additifs généralisés ne sont pas facilement interprétés, en particulier lorsqu`ils impliquent des effets non linéaires complexes de certaines ou de toutes les variables prédictitrices (et, bien sûr, c`est dans les cas où les modèles additifs généralisés peuvent donner un meilleur ajustement que modèles linéaires généralisés). Pour réitérer, il est généralement préférable de s`appuyer sur un modèle simple et bien compris pour prédire les cas futurs, que sur un modèle complexe qui est difficile à interpréter et à résumer. Pour résumer, au lieu d`estimer des paramètres uniques (comme les pondérations de régression dans la régression multiple), dans les modèles additifs généralisés, nous trouvons une fonction générale non spécifique (non paramétrique) qui relie les valeurs Y prédites (transformées) à la valeurs prédictitrices.

En commun avec la plupart des fonctions de modélisation R GAM attend une formule de modèle à fournir, en spécifiant la structure du modèle pour s`adapter. La variable de réponse est donnée à gauche du ~ tandis que la spécification du prédicteur linéaire est donnée à la droite. GAM met en place des bases et des pénalités pour les termes lisses, estime le modèle, y compris ses paramètres de lissage et, en mode R standard, retourne un objet de modèle ajusté, qui peut ensuite être interrogé à l`aide de diverses fonctions d`assistance, telles que résumé, tracer, prédire et Aic.