Linear regression - Reading Results
Multiple linear regression is a statistical modeling technique. It aims to predict and explain the values taken by an endogenous variable quantity Y from p exogenous variables X1, ..., Xp, quantitative or qualitative rendered by binary recoding.
In this tutorial, through an example for predicting the fuel consumption from their weight and capacity, and power, we will describe the outputs of Tanagra by associating them with the formulas used. We will forward the role of the matrix (X'X) ^ (-1) provided since version 1.4.38 . It is important because it holds a central place in les tests généralisés sur les coefficients. Nous en accomplirons quelques uns manuellement avec le tableur Excel.
Dans un deuxième temps, nous réaliserons la régression à l'aide du logiciel R. Nous mettrons en parallèle ses résultats avec ceux de TANAGRA. Nous identifierons les objets qui fournissent les informations nécessaires aux différents post-traitements, notamment les tests généralisés. Nous effectuerons alors les calculs réalisés précédemment dans Excel directement dans R.
Mots clés : régression linéaire multiple, logiciel R, lm, tests généralisés, tests de conformité, tests de comparaison
Components: MULTIPLE LINEAR REGRESSION
Link: fr_Tanagra_Multiple_Regression_Results.pdf
Data : cars_consumption.zip
References:
R. Rakotomalala, Multiple linear regression - Slideshow
Voltaire Scam Bedding And Linens World
Thursday, February 10, 2011
Thursday, February 3, 2011
Tablets That Will Make Me Have A Tan
Tanagra - Version 1.4.38
few minor corrections to version 1.4.38 of Tanagra.
The color codes of normality tests have been harmonized ( Normality Test). Under the procedure, the colors associated with p-values were not consistent, misleading the clinician. This problem has been reported by Laurent Garmendia.
Following indications from Mr. Oanh Chau, I realized that the standardization of variables for HAC (hierarchical agglomerative) was based on the standard deviation of sample. This is not an error in itself. But suddenly, the sum of indices of level in the dendrogram does not coincide with the TSS (total sum of squares). It's more embarrassing. The difference is especially noticeable on small files, it disappears when the size increases. The correction has been introduced, now the BSS ratio "is worth 1 when we have the trivial partition ie d. one individual per group.
La régression linéaire multiple ( MULTIPLE LINEAR REGRESSION ) fournit maintenant la matrice (X'X)^(-1). Elle permet de déduire la matrice de variance covariance des coefficients (en la pré-multipliant par la variance estimée de l'erreur). Elle rentre aussi dans les tests généralisés sur les coefficients : les tests de conformité simultanés; les tests de combinaisons linéaires. Ces tests sont décrits (entres autres) dans les diaporamas de mes enseignements d'économétrie en Licence IDS.
Enfin, les sorties de l'analyse discriminante descriptive ( CANONICAL DISCRIMINANT ANALYSIS ) ont été complétées. Les barycentres des groupes (Group centroïds) sur les axes factoriels sont directement fournies.
Merci infiniment à toutes les personnes qui, par leurs commentaires ou leurs suggestions, m'aident à améliorer quotidiennement le travail que je mets en ligne (logiciel, documents).
Page de téléchargement de Tanagra : setup
few minor corrections to version 1.4.38 of Tanagra.
The color codes of normality tests have been harmonized ( Normality Test). Under the procedure, the colors associated with p-values were not consistent, misleading the clinician. This problem has been reported by Laurent Garmendia.
Following indications from Mr. Oanh Chau, I realized that the standardization of variables for HAC (hierarchical agglomerative) was based on the standard deviation of sample. This is not an error in itself. But suddenly, the sum of indices of level in the dendrogram does not coincide with the TSS (total sum of squares). It's more embarrassing. The difference is especially noticeable on small files, it disappears when the size increases. The correction has been introduced, now the BSS ratio "is worth 1 when we have the trivial partition ie d. one individual per group.
La régression linéaire multiple ( MULTIPLE LINEAR REGRESSION ) fournit maintenant la matrice (X'X)^(-1). Elle permet de déduire la matrice de variance covariance des coefficients (en la pré-multipliant par la variance estimée de l'erreur). Elle rentre aussi dans les tests généralisés sur les coefficients : les tests de conformité simultanés; les tests de combinaisons linéaires. Ces tests sont décrits (entres autres) dans les diaporamas de mes enseignements d'économétrie en Licence IDS.
Enfin, les sorties de l'analyse discriminante descriptive ( CANONICAL DISCRIMINANT ANALYSIS ) ont été complétées. Les barycentres des groupes (Group centroïds) sur les axes factoriels sont directement fournies.
Merci infiniment à toutes les personnes qui, par leurs commentaires ou leurs suggestions, m'aident à améliorer quotidiennement le travail que je mets en ligne (logiciel, documents).
Page de téléchargement de Tanagra : setup
Subscribe to:
Posts (Atom)