<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="/rss20.xsl" media="screen"?>
<rss xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<atom:link href="http://lemondedesetudes.hautetfort.com/methodologie-quanti/index.rss" rel="self" type="application/rss+xml" />
<title>Le monde des études - methodologie-quanti</title>
<description>Études / Marketing / Communication</description>
<link>http://lemondedesetudes.hautetfort.com/methodologie-quanti/</link>
<lastBuildDate>Mon, 09 Nov 2009 10:40:34 +0100</lastBuildDate>
<generator>Hautetfort.com</generator>
<copyright>All Rights Reserved</copyright>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/11/09/la-dynamique-du-questionnaire.html</guid>
<title>La dynamique du questionnaire</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/11/09/la-dynamique-du-questionnaire.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 21 Dec 2009 08:39:00 +0100</pubDate>
<description>
&lt;p&gt;Dans la construction du questionnaire, la dynamique de celui-ci est un point relativement logique et rapide à aborder mais néanmoins très important.&lt;/p&gt; &lt;p&gt;Un questionnaire doit en effet permettre de répondre aux besoins en information que nous avons... mais il doit le faire de façon intelligente. Et une règle s'impose ici : &lt;span style=&quot;color: #000000;&quot;&gt;&lt;b&gt;construire son questionnaire&lt;/b&gt;&lt;/span&gt;. Celui-ci doit en effet suivre un déroulement logique, écrit (ou en tout cas prévu) à l'avance par l'institut.&lt;/p&gt; &lt;p&gt;Ainsi, et dans la plupart des cas, &lt;b style=&quot;color: #0099cc&quot;&gt;le questionnaire est construit en entonnoir : on pose les questions les plus larges et les moins implicantes en premier&lt;/b&gt;. Cela permet de mettre à l'aise l'interrogé (qui prend le temps de s'acclimater avec le sujet pendant ces questions) et de recentrer peu à peu &quot;l'interview&quot; sur les questions plus précises ou sur les questions plus difficiles voire sur la vie privée.&lt;/p&gt; &lt;p&gt;Dans la même logique de progression, si votre questionnaire comporte plusieurs thèmes ne s'enchaînant pas forcément logiquement, il est préférable &lt;b style=&quot;color: #0099cc&quot;&gt;d'écrire noir sur blanc des phrases de transition entre les thèmes&lt;/b&gt; (&lt;i&gt;&quot;nous allons maintenant parler de...&quot;&lt;/i&gt;). Cela facilitera la tâche au terrain et permettra de ne pas désarçonner l'interviewé avec une question innattendue (et donc potentiellement mal comprise).&lt;/p&gt; &lt;p&gt;De plus, la plupart des questionnaires comporte des &lt;b style=&quot;color: #0099cc&quot;&gt;questions filtres&lt;/b&gt;. Celles-ci viennent séparer l'échantillon de répondants : certains répondront à des questions que les autres sauteront. Il faut alors anticiper la place de ces filtres, et vérifier la logique d'enchainement du questionnaires pour les individus filtrés et les non filtrés. Personnellement, j'ai tendance à recommander de ne pas trop utiliser les questions filtres (même si elles sont très pratiques) : utilisées à outrance, elles viennent fortement compliquer le questionnaire.&lt;/p&gt; &lt;p&gt;Enfin, les questions de profil doivent également faire l'objet d'une petite réflexion au moment de la construction du questionnaire. Souvent placées à la fin du questionnaire, elles &lt;b style=&quot;color: #0099cc&quot;&gt;doivent absolument contenir toutes les infos nécessaires pour un éventuel futur ciblage&lt;/b&gt;. A noter qu'elles sont, bien sur, parfois placées en début de questionnaire, notamment lors d'échantillon par quotas, afin de vérifier dès le début les quotas et de ne poursuivre l'interview que si nécessaire.&lt;/p&gt; &lt;p&gt;Concernant les questions de profil, pour ceux qui l'ignorent, &lt;b style=&quot;color: #0099cc&quot;&gt;les questionnaires sont anonymes&lt;/b&gt;, cette règle faisant partie du code de déontologie des instituts d'étude (&lt;a title=&quot;charte des pratiques éthiques dans les études sur Internet&quot; href=&quot;http://www.efamro.com/downloads/Syntec%20Internet%20Guidelines%20%28%20French%29%20.pdf&quot;&gt;règle rappelée dans la charte des pratiques éthiques dans les études sur Internet&lt;/a&gt;).&lt;/p&gt;
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/11/03/construire-le-questionnaire-1.html</guid>
<title>Construire le questionnaire (1) : processus d'élaboration</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/11/03/construire-le-questionnaire-1.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 30 Nov 2009 08:22:00 +0100</pubDate>
<description>
&lt;p&gt;Suite aux dernières étapes passées en revue dans ce blog, vous avez maintenant les principaux outils pour constituer votre échantillon. Il convient maintenant &lt;b style=&quot;color: #0099cc;&quot;&gt;d'interroger cet échantillon via un questionnaire&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;L'étape de la construction du questionnaire est fondamentale dans l'étude. Sans un bon questionnaire, impossible de répondre à la problématique posée... et les nuances dans les questions et dans le questionnaires sont nombreuses, la construction du questionnaire va donc solliciter notre intérêt pendant plusieurs notes.&lt;/p&gt; &lt;p&gt;Ici, je vous renvoie vers &lt;a title=&quot;Market sur amazon&quot; href=&quot;http://www.amazon.fr/Market-Fondements-m%C3%A9thodes-recherches-marketing/dp/2100527967/ref=sr_1_1?ie=UTF8&amp;amp;s=books&amp;amp;qid=1257252405&amp;amp;sr=8-1&quot;&gt;MARKET&lt;/a&gt;. Dans ce livre les étapes de construction d'un questionnaire sont très bien listées ; voici un shéma synthétique reprenant celles-ci :&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;img src=&quot;http://lemondedesetudes.hautetfort.com/images/%C3%A9tapes_questionnaire.png&quot; style=&quot;border: 2px black&quot; /&gt;&lt;/p&gt; &lt;p&gt;La première étape semble assez simple, c'est celle qui amène à faire l'étude. Toutefois, on comprend rapidement, quand on regarde la deuxième étape que ce n'est pas si simple. En effet, &lt;b style=&quot;color: #0099cc;&quot;&gt;traduire la problématique en besoins en information permet de limiter les contours des celle-ci&lt;/b&gt;, ce qui est déjà très complexe. En effet, que celui qui n'a jamais eu du mal à limiter son client sur les informations à collecter avec le questionnaire me jette la première pierre !&lt;/p&gt; &lt;p&gt;Il convient alors, dans ces deux premières étapes de se concentrer sur les besoins en information relatif à l'étude... et non de laisser libre champs à toutes les questions, le client &quot;profitant&quot; de l'étude pour interroger sur tout et n'importe quoi. Cela peut être facilité si le problème a bien été posé dès le début (dans la proposition commerciale, l'institut intègre souvent une partie &quot;problématique&quot;) et les hypothèses de recherche définies (encore une fois, je vous renvoie vers &lt;a title=&quot;Market sur amazon&quot; href=&quot;http://www.amazon.fr/Market-Fondements-m%C3%A9thodes-recherches-marketing/dp/2100527967/ref=sr_1_1?ie=UTF8&amp;amp;s=books&amp;amp;qid=1257252405&amp;amp;sr=8-1&quot;&gt;Market&lt;/a&gt;, très complet sur le sujet).&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #0099cc;&quot;&gt;Une fois les besoins en information bien définis et limités, ceux-ci doivent être traduit en questions&lt;/b&gt;. Nous le verrons dans les prochaines notes sur le questionnaire, un vaste travail attend ici l'institut. Il s'agit de trouver les questions idéales pour mesurer un phénomène, alors que les possibilités sont nombreuses et les biais possibles encore plus importants. Ici, &lt;span style=&quot;color: #000000;&quot;&gt;&lt;span style=&quot;text-decoration: underline;&quot;&gt;&lt;b&gt;tout compte : la question, son type, sa nature, ses modalités de réponses, sa capacité à mesurer un phénomène et l'ordre qu'elle a dans le questionnaire&lt;/b&gt;&lt;/span&gt;&lt;/span&gt; (d'ou un traitement en plusieurs notes).&lt;/p&gt; &lt;p&gt;Nous avons déjà vu les questions d'échantillonnage et de mode d'interview, &lt;a title=&quot;Méthodologies quantitatives&quot; href=&quot;http://lemondedesetudes.hautetfort.com/methodologie-quanti/&quot;&gt;je vous renvoie ici&lt;/a&gt;.&lt;/p&gt; &lt;p&gt;Enfin, une fois élaboré, le questionnaire n'est théoriquement pas terminé. L'étape du prétest n'est pas courante en institut mais plus en recherche. En général, ce prétest se fait sur une trentaine de personnes ; &lt;b style=&quot;color: #0099cc;&quot;&gt;celui-ci permet de valider le premier jet ou d'y porter des modifications avant validation avec le client&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Comme je vous le disais, nous nous attarderons sur plusieurs de ces étapes et sous-étapes dans les prochaines notes, notamment sur la dynamique du questionnaire, les types et natures des questions, et les biais.&lt;/p&gt;
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/07/20/quelques-questions-a-se-poser-avant-de-creer-le-questionnair.html</guid>
<title>Quel mode d'enquête ?</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/07/20/quelques-questions-a-se-poser-avant-de-creer-le-questionnair.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 26 Oct 2009 09:00:00 +0100</pubDate>
<description>
&lt;p&gt;Nous l'avons vu, un institut propose à son client/prospect une méthodologie à partir de contrainte théoriques (échantillons probabilistes et empiriques : &lt;a target=&quot;_self&quot; title=&quot;principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;1&lt;/a&gt;, &lt;a target=&quot;_self&quot; title=&quot;méthodes probabilistes&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/01/12/les-methodes-de-sondage-part-1.html&quot;&gt;2&lt;/a&gt;, &lt;a target=&quot;_self&quot; title=&quot;méthodes empiriques&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html&quot;&gt;3&lt;/a&gt; / &lt;a target=&quot;_blank&quot; title=&quot;Les panels&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/03/30/les-panels.html&quot;&gt;les panels&lt;/a&gt;, / la représentativité &lt;a target=&quot;_self&quot; title=&quot;Représentativité et test d'ajustement du khi²&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html&quot;&gt;1&lt;/a&gt; et &lt;a target=&quot;_self&quot; title=&quot;Les redressements&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2010/07/12/la-representativite-part-ii-les-redressements.html&quot;&gt;2&lt;/a&gt;) et de contraintes pratiques :&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://lemondedesetudes.hautetfort.com/images/Choix_methode_sondage.PNG&quot;&gt;&lt;img src=&quot;http://lemondedesetudes.hautetfort.com/images/Choix_methode_sondage.PNG&quot; style=&quot;max-width: 899px; width: 90%;&quot; /&gt;&lt;/a&gt;&lt;/p&gt; &lt;p&gt;Nous avons déjà présenté les différentes méthodes &lt;a target=&quot;_self&quot; title=&quot;méthodes probabilistes&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/01/12/les-methodes-de-sondage-part-1.html&quot;&gt;probabilistes&lt;/a&gt; et &lt;a target=&quot;_self&quot; title=&quot;méthodes empiriques&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html&quot;&gt;empiriques&lt;/a&gt; de sondage qu'il existe.&lt;/p&gt; &lt;p&gt;Notons cependant qu'&lt;b style=&quot;color: #ff9f3f&quot;&gt;il existe différents modes d'enquête&lt;/b&gt; qui peuvent s'appliquer pour chaque des méthodes de sondage :&lt;/p&gt; &lt;ul&gt; &lt;li&gt;&lt;b style=&quot;color: #006699&quot;&gt;L'enquête par téléphone&lt;/b&gt;.&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #0066cc&quot;&gt;L'enquête postale&lt;/b&gt;.&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #0000ff&quot;&gt;L'enquête par Internet&lt;/b&gt;.&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #333399&quot;&gt;L'enquête en face à face&lt;/b&gt;.&lt;/li&gt; &lt;/ul&gt; &lt;p&gt;Voici les principaux avantages et inconvénients de ces méthodes :&lt;/p&gt; &lt;table style=&quot;border-collapse: collapse; border: 1px solid black&quot; width=&quot;100%&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: center;&quot; width=&quot;100&quot;&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: center;&quot; width=&quot;120&quot;&gt;&lt;b style=&quot;color: #006699&quot;&gt;L'enquête par téléphone&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: center;&quot; width=&quot;120&quot;&gt;&lt;b style=&quot;color: #0066cc&quot;&gt;L'enquête postale&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: center;&quot; width=&quot;120&quot;&gt;&lt;b style=&quot;color: #0000ff&quot;&gt;L'enquête par Internet&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: center;&quot; width=&quot;120&quot;&gt;&lt;b style=&quot;color: #333399&quot;&gt;L'enquête en face à face&lt;/b&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Durée d'administration&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left; background-color: #fce4bf&quot;&gt;Ne doit pas excéder 30 min.&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left; background-color: #fce4bf&quot;&gt;Privilégier des questionnaire de 5 à 6 pages&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left; background-color: #eec1c9&quot;&gt;Ne doit pas excéder 10 à 15 min.&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left; background-color: #e5efc2&quot;&gt;Peut durer plus d'une heure si rdv. Sinon ne doit pas excéder 10 à 15 min.&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Souplesse d'administration&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #fce4bf&quot;&gt;Difficulté pour montrer des images mais interactions possibles entre enquêteur / enquêté&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;Aucune interaction possible&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Possibilité de montrer des images, quelques interactions via les filtres&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left; background-color: #bfd8cb&quot;&gt;Souplesse totale : possibilité de tester des objets, des packaging, etc.&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Rapidité de la réalisation de l'enquête&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Rapide (si les fichiers sont bons &amp;gt; un bon fichier contient 3 ou 4 fois le nombre d'interviews à faire)&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;Lent voire très lent&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Rapide (si suffisament de contacts).&lt;br /&gt; Possibilité d'avoir un traitement automatisé des réponses&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Variable (dépend de la cible)&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Contrôle de l'échantillon&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;Maîtrise totale&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;Aucune maîtrise (qui répond ?)&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Maîtrise totale mais difficile d'avoir un échantillon représentatif de la population française (personnes agées peu équipées par exemple)&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;Maîtrise totale&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Couverture géographique&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Grande voire illimitée&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Grande voire illimitée&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;Illimitée&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #fce4bf&quot;&gt;Limitée (coûts d'enquête)&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Taux de non réponse&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #fce4bf&quot;&gt;Le taux de non réponse varie souvent entre 20 et 40%.&lt;br /&gt; Problème des listes rouges&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;Taux de non réponse souvent très élevé&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #fce4bf&quot;&gt;Le taux de non réponse varie mais semble relativement élevé &lt;i&gt;(si vous avez des infos, je suis preneur)&lt;/i&gt;&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;Très variable&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Coûts&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Coûts dépendent de la distance des appels&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #e5efc2&quot;&gt;Coûts postaux&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;Coûts peu élevés&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #fce4bf&quot;&gt;Coûts plus élevés (frais de déplacement, etc.)&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Avantages notables&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;- Possibilité de fixer des Rdv&lt;br /&gt; - Bonne implication des répondants&lt;br /&gt; - Grande possibilité de contrôle du terrain&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;- Grande liberté de réponse pour l'interviewé&lt;br /&gt; - Possibilité de faire une opération de communication en même temps que l'enquête&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;- Grande liberté de réponse pour l'interviewé&lt;br /&gt; - Gestion des quotas automatisée&lt;br /&gt; - Coûts&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #bfd8cb&quot;&gt;- Enquête in situ&lt;br /&gt; - Dialogue, possibilité de poser des questions plus &quot;privées&quot;&lt;br /&gt; - Opération de communication interne auprès du personnel qui voit le déroulement de l'enquête&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;&quot;&gt;&lt;b style=&quot;color: black&quot;&gt;Inconvénients notables&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;- Nécessite de bons fichiers&lt;br /&gt; - Durée du questionnaire réduite&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;- Nécessite un gros travail sur le questionnaire, qui doit être limpide&lt;br /&gt; - Délais alongés&lt;br /&gt; - Réponses parfois illisibles, questionnaires inexploitables&lt;br /&gt; - Taux de non réponse&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;- Seuls les internautes peuvent répondre&lt;br /&gt; - Taux de non réponse&lt;/td&gt; &lt;td style=&quot;border: 1px solid black; padding: 2px; text-align: left;background-color: #eec1c9&quot;&gt;- Biais d'enquête&lt;br /&gt; - Organisation complexe&lt;br /&gt; - Coûts&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt;
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/08/17/la-representativite-part-iii-quel-taille-d-echantillon-pour.html</guid>
<title>La représentativité (part. III) : les intervalles de confiance : quelle taille d'échantillon pour quelle précision ? + un cadeau !</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/08/17/la-representativite-part-iii-quel-taille-d-echantillon-pour.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 31 Aug 2009 09:02:00 +0200</pubDate>
<description>
&lt;p&gt;Si vous avez suivi ce qu'on a vu, théoriquement, vous &lt;b style=&quot;color: #0099cc&quot;&gt;savez comment obtenir un échantillon représentatif&lt;/b&gt; de votre population.&lt;/p&gt; &lt;p&gt;&lt;span style=&quot;border: 1px dotted black; padding: 5px; display: block; width: 90%; background-color: #ffffd2;&quot;&gt;&lt;b style=&quot;color: #ff9f3f&quot;&gt;Petit rappel :&lt;/b&gt; cet échantillon peut être représentatif car vous avez utilisé une &lt;a target=&quot;_self&quot; title=&quot;méthodes probabilistes&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/01/12/les-methodes-de-sondage-part-1.html&quot;&gt;méthode probabiliste&lt;/a&gt; ou parce que vous avez construit votre échantillon de façon à ce qu'il &lt;a target=&quot;_self&quot; title=&quot;méthodes empiriques&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html&quot;&gt;reflète quelques caractéristiques clés&lt;/a&gt; de la population (on peut vérifier cette représentativité avec &lt;a target=&quot;_self&quot; title=&quot;test d'ajustement du khi²&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html&quot;&gt;le test d'ajustement du khi²&lt;/a&gt; et dans le cas où l'échantillon n'est pas représentatif, on peut recourir aux &lt;a target=&quot;_self&quot; title=&quot;redressements&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2010/07/12/la-representativite-part-ii-les-redressements.html&quot;&gt;redressements&lt;/a&gt;).&lt;/span&gt;&lt;/p&gt; &lt;p&gt;Maintenant il s'agit de &lt;b style=&quot;color: #0099cc&quot;&gt;savoir combien d'individus vous allez interroger&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Bien entendu, cela dépendra en grande partie du budget et de la méthode de sondage. Mais pas seulement. Le nombre d'individus interrogés va en effet jouer sur la précision des résultats que nous allons obtenir une fois les questionnaires administrés et saisis.&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #000000&quot;&gt;La confiance que l'on va accorder à nos résultats va donc changer en fonction du nombre d'individus interrogés&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;A noter qu'à la base, l'intervalle de confiance (ou marge d'erreur) est un principe statistique qui ne s'applique théoriquement qu'aux échantillons aléatoires, mais les gens des études étant prudents, ils ont généralisé cette pratique aux échantillons empiriques.&lt;/p&gt; &lt;p&gt;Le principe est plutôt simple : si 10% des gens que vous avez interrogé répondent &quot;oui, j'ai l'intention d'acheter le produit X&quot;, on ne pourra dire que dans la population (française par exemple), 10% des gens auront l'intention d'acheter le produit... A cause des effets de hasard, un peu de prudence est en effet de rigueur, surtout si vous n'avez interrogé que 100 personnes !&lt;/p&gt; &lt;p&gt;Ainsi un calcul d'intervalle de confiance (je ne détaille pas ici la formule, &lt;a title=&quot;Intervalle de confiance wikipedia&quot; href=&quot;http://fr.wikipedia.org/wiki/Intervalle_de_confiance&quot;&gt;je vous renvoie à Wikipedia&lt;/a&gt;) nous permet de savoir qu'en interrogeant 100 personnes, si 10% d'entre elles disent &quot;oui, j'ai l'intention d'acheter le produit X&quot;, on peut prévoir que l'intention d'achat déclarée dans la population sera comprise entre 4.1% et 15.9%.&lt;/p&gt; &lt;p&gt;Un échantillon de 1000 personnes avec 10% de &quot;oui, j'ai l'intention d'acheter le produit X&quot; aurait pu affiner la prévision de l'intention d'achat déclarée dans la population entre 8.1% et 11.9%.&lt;/p&gt; &lt;p&gt;&lt;span style=&quot;color: #000000;&quot;&gt;&lt;b&gt;En augmentant la taille de l'échantillon, on augmente la précision de nos résultats&lt;/b&gt;&lt;/span&gt;. Bien sur, on ne va pas mettre un budget énorme pour améliorer la précision d'un sondage (surtout qu'il faut multiplier par 4 l'échantillon pour améliorer la précision deux fois) mais c'est &lt;span style=&quot;color: #000000;&quot;&gt;&lt;b&gt;important de définir une taille d'échantillon suffisante pour une précision adéquate, le tout dans un budget défini&lt;/b&gt;&lt;/span&gt;. A noter que parfois, il est utile de proposer des sondages sur peu d'individus (donc peu chers) si on n'a aucune connaissance d'une problématique ou alors qu'on sait que les comportements et avis sont très tranchés sur un sujet (et donc moins soumis aux aléas et sur lesquels les intervalles de confiance sont donc moins grands).&lt;/p&gt; &lt;p&gt;Voilà pour le principe. Pour concrétiser cela, &lt;b style=&quot;color: #ff9f3f&quot;&gt;je vais vous faire un petit cadeau&lt;/b&gt; !&lt;/p&gt; &lt;p&gt;Le fichier Excel que vous pouvez télécharger ci-dessous &lt;b style=&quot;color: #0099cc&quot;&gt;vous servira à calculer automatiquement les intervalles de confiance pour un échantillon donné&lt;/b&gt; (remplir la case verte).&lt;/p&gt; &lt;p style=&quot;text-align: center&quot;&gt;&lt;a href=&quot;http://lemondedesetudes.hautetfort.com/files/intervalles_de_confiance.xls&quot;&gt;&lt;img src=&quot;http://www.clipart-fr.com/data/icones/series_02/icones_00541.png&quot; /&gt;&lt;/a&gt;&lt;br /&gt; &lt;a title=&quot;Télécharger la présentation&quot; href=&quot;http://lemondedesetudes.hautetfort.com/files/intervalles_de_confiance.xls&quot;&gt;Télécharger l'outil (.xls)&lt;/a&gt;&lt;/p&gt; &lt;p&gt;Cliquez droit sur le lien &amp;gt; Enregistrer la cible du lien sous... voilà !&lt;/p&gt;
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2010/07/12/la-representativite-part-ii-les-redressements.html</guid>
<title>La représentativité (part. II) : les redressements</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2010/07/12/la-representativite-part-ii-les-redressements.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 27 Jul 2009 08:34:00 +0200</pubDate>
<description>
&lt;p&gt;Vous le savez, (sinon voir &lt;a target=&quot;_self&quot; title=&quot;Note sur le principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;ici&lt;/a&gt;) dans une étude, &lt;b style=&quot;color: #000000;&quot;&gt;on se focalise sur un échantillon pour généraliser les résultats mesurés à une population&lt;/b&gt;. Pour ceci, l'échantillon doit être représentatif de la population ; i.e. avoir des caractéristiques comparables à la population (notez que je fais référence aux échantillons empiriques ; plus de détails et de nuances &lt;a target=&quot;_self&quot; title=&quot;Note sur le principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;ici&lt;/a&gt;).&lt;/p&gt; &lt;p&gt;&lt;a target=&quot;_self&quot; title=&quot;Note sur la partie I de la représentativité&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html&quot;&gt;Nous l'avons vu&lt;/a&gt;, il arrive souvent que l'on n'arrive pas à obtenir un échantillon avec les mêmes caractéristiques que la population (on n'arrive pas à interroger assez de femmes, ou pas assez de CSP+, ou pas assez de retraités, etc.). &lt;b&gt;La première chose à faire est alors de vérifier que l'échantillon est représentatif malgré les différences sur ces caractéristiques&lt;/b&gt; (&lt;a target=&quot;_self&quot; title=&quot;Note sur la partie I de la représentativité&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html&quot;&gt;cf. ici&lt;/a&gt;).&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #000000;&quot;&gt;Mais que faire quand le test d'ajustement du khi² vous apprends que votre échantillon n'est pas représentatif de votre population&lt;/b&gt; (pour mémoire, dans mon exemple sur la note consacrée au test d'ajustement du khi², j'avais volontairement pris un échantillon qui était représentatif malgré les différences avec la population sur les caractéristiques de représentativité) ?&lt;/p&gt; &lt;p&gt;La première possibilité est d'interroger plus d'individus des catégories mal représentées. Bien sur, cela n'est faisable que si le budget et le temps nécessaires sont disponibles... et que les individus qui &quot;manquent&quot; sont joignables.&lt;/p&gt; &lt;p&gt;L'autre possibilité, fréquemment utilisée dans les études, est de &lt;span style=&quot;text-decoration: underline;&quot;&gt;&lt;b style=&quot;color: #000000;&quot;&gt;recourir au(x) redressement(s)&lt;/b&gt;&lt;/span&gt;.&lt;/p&gt; &lt;p&gt;Le principe des redressements est en fait d'estimer les réponses des non-répondants (les individus qu'on n'a pas réussi à interroger en nombre suffisant) grâce aux réponses des répondants.&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #ff9f3f;&quot;&gt;Concrètement&lt;/b&gt;, il s'agit d'&lt;b&gt;appliquer un coefficient de pondération&lt;/b&gt; (coefficient de redressement ; celui-ci est calculé par tous les logiciels statistiques) aux questionnaires enregistrés.&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #ff9f3f;&quot;&gt;Exemple&lt;/b&gt; : si nous n'avons réussi qu'à obtenir 45% de femmes dans notre échantillon alors qu'il devait en contenir 52% pour être représentatif de notre population, le redressement va pondérer les questionnaires remplis par des femmes par un coefficient de 1.15 (52% divisé par 45%). De plus, le redressement va, logiquement, appliquer un coefficient de 0.87 aux questionnaires remplis par les hommes (48% divisé par 55%).&lt;/p&gt; &lt;table style=&quot;margin: 5px; padding: 5px; border-collapse: collapse; background-color: white; text-align: center; height: 101px;&quot; width=&quot;285&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Catégories&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;% obtenus&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;% souhaités&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Coeff. de redressement&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Femmes&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;45%&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid grey; margin: 5px; padding: 5px; background-color: white; text-align: center;&quot;&gt;52%&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;1.15&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Hommes&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;55%&lt;br /&gt;&lt;/td&gt; &lt;td style=&quot;border: 1px solid grey; margin: 5px; padding: 5px; background-color: white; text-align: center;&quot;&gt;8.0%&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;0.87&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;Le pincipe des redressements est finalement assez simple : il &lt;b style=&quot;color:#0099cc&quot;&gt;s'agit de baisser ou d'augmenter le poids de certains questionnaires afin de faire coller les critères de l'échantillon avec ceux de la population&lt;/b&gt;. Le but est bien sûr d'appliquer les coefficients trouvés à toutes les réponses du questionnaire.&lt;/p&gt; &lt;p&gt;Si le but est simple, &lt;span style=&quot;color: #000000;&quot;&gt;&lt;b&gt;j'ai tendance à penser que les redressements doivent être utilisés avec beaucoup de pédagogie et de prudence&lt;/b&gt;&lt;/span&gt;. Les redressements &quot;créent&quot; en effet des réponses virtuelles (même si basées sur les réponses mesurées). Cela peut-être perturbant pour un client qui ne vient pas des études d'avoir à faire à des effectifs qui ne sont pas vraiment concrets...&lt;/p&gt; &lt;p&gt;L'autre prudence à avoir est de ne pas éxagérer un redressement... Quelle légitimité d'un redressement qui multiplie le poids d'une catégorie d'individu par 10 ? De mon côté, je ne connais pas de recommandation &quot;officielle&quot; (statistiquement parlant) sur les limites à considérer pour les redressements. J'ai tendance à me méfier d'un redressement effectué sur moins de 50 indivuds et / ou d'un redressement qui va multiplier le poids de certains individus par plus de 2 (mais bien sur, cela est à étudier au cas par cas, en fonction de l'homogénéité des comportements et de la difficulté du terrain).&lt;/p&gt; &lt;table style=&quot;margin: 5px; padding: 2px; border-collapse: collapse; text-align: left&quot; width=&quot;90%&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;border:&quot; onclick=&quot;document.getElementById('redressements').innerHTML ='&amp;lt;b&amp;gt;Le redressement d’échantillons&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Le redressement d’échantillons est une pratique courante dans l’univers des études et des sondages. Certains résultats ne s’envisagent d’ailleurs tout simplement pas sans le recours préalable à cette technique. C’est le cas notamment des sondages politiques, dont les valeurs sont toujours fournies après l’application de multiples calages, pour prendre en compte les répartitions socio-démographiques, les résultats des élections précédentes et d’autres ajustements plus contestables comme l’expérience du sondeur par exemple (avec les succès que l’on sait).&amp;lt;br /&amp;gt; Ce dossier vise à expliciter les objectifs et les méthodes du redressement d’échantillons, dans le domaine des études marketing.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;Redresser un échantillon, pour quoi faire ?&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Dans le domaine des études marketing, le redressement d’échantillons a pour objectif d’améliorer la représentativité de l’échantillon interrogé, sur un certain nombre de critères de qualification. Le principe sous-jacent est que seul un échantillon ayant la même structure que la population-mère sur les critères que l’on connaît de cette population, permet de généraliser les réponses obtenues sur les autres critères, à l’ensemble de cette population. Le redressement cherche donc à appliquer des pondérations aux individus pour augmenter le poids de ceux appartenant à des groupes sous-représentés dans l’échantillon interrogé par rapport à la population-mère, et à réduire parallèlement le poids de ceux qui sont sur-représentés.&amp;lt;br /&amp;gt; Mais pourquoi alors ne pas interroger directement un échantillon représentatif sur les critères souhaités ?&amp;lt;br /&amp;gt; C’est ce que les chargés d’études cherchent à faire, lorsqu’ils établissent des quotas que les enquêteurs doivent respecter. Mais dans les faits, il est souvent difficile voire impossible de respecter parfaitement ces quotas en trouvant exactement le bon nombre de personnes dans chacune des catégories retenues. La pression économique et les délais généralement courts n’arrangent pas les choses. Les queues de quotas, cauchemar des chargés de terrain et superviseurs CATI finissent par faire l’objet de compromis.&amp;lt;br /&amp;gt; Par ailleurs, dans beaucoup d’enquêtes, il n’est pas possible de contrôler a priori l’échantillon qui va répondre. C’est notamment le cas dans les enquêtes auto-administrées (questionnaires postaux, en libre service, placés sur un site internet, etc) qui fournissent systématiquement des échantillons non représentatifs (ceux qui ont bien voulu répondre). C’est également le cas des enquêtes de plus en plus fréquentes réalisées en utilisant le média Internet, même lorsqu’elles sont menées sur des internautes recherchés et sollicités nominativement par l’institut d’études. Dans ce cas, la structure actuelle de pénétration du média internet dans les ménages (sur-évaluation des jeunes et des CSP+) entraîne une difficulté à dénicher certains profils et, par conséquent, la nécessité d’appliquer a posteriori des pondérations sur l’échantillon obtenu.&amp;lt;br /&amp;gt; Le redressement vient donc pallier ces difficultés. Mais il faut bien prendre garde à un élément fondamental : des pondérations trop importantes font courir un risque certain à la qualité des résultats. Ainsi, il semble aberrant de donner un poids 10 fois plus important, comme cela se pratique parfois, aux réponses de la seule personne que l’on a réussi à interroger dans une catégorie donnée. On comprend facilement que si les réponses d’un groupe de cadres supérieurs a des chances de refléter en moyenne l’opinion de l’ensemble de cette population, les opinions d’un seul d’entre eux a une probabilité beaucoup plus faible de permettre la même extrapolation. Il est donc important de chercher, autant que possible, à obtenir en amont des échantillons cohérents, en ne se disant pas que de toute manière, il suffira ensuite de redresser.&amp;lt;br /&amp;gt; En substance, on pourrait dire que moins on a besoin de recourir aux redressements, meilleurs sont les résultats!&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;Sur quelles variables redresser ?&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Le choix des variables de redressement est simple en théorie mais plus complexe dans la pratique. En effet, l’idéal serait d’utiliser toutes les variables sur lesquelles la répartition de la population-mère est connue de manière fiable. Ces éléments sont généralement recherchés dans les données des recensements disponibles auprès de l’Insee, ou, lorsqu’il s’agit d’enquêtes sur des univers spécifiques (ex : clients, distributeurs), dans les fichiers internes disponibles.&amp;lt;br /&amp;gt; Les difficultés sont multiples :&amp;lt;br /&amp;gt; La population-mère doit être définie de manière précise pour éviter de prendre en compte des statistiques disponibles sur une population proche mais pas identique. Ainsi la population active peut correspondre à plusieurs définitions et délimitations. La population des jeunes peut correspondre à des tranches d’âge différentes…&amp;lt;br /&amp;gt; Il faut s’assurer que les répartitions disponibles sont conformes aux catégories utilisées dans l’enquête. Il convient pour cela d’utiliser dans les questionnaires les rubriques standards de l’INSEE en ce qui concerne par exemple les catégories socio-professionnelles, les secteurs d’activité, …&amp;lt;br /&amp;gt; La formulation de la question renseignée pour la population-mère doit être identique à celle posée à l’échantillon. Ainsi, la population des personnes ayant déjà fréquenté un parc de loisir est différente de celle qui a visité un parc de loisir depuis moins de deux ans. La population des personnes connaissant Internet est différente de celle des utilisateurs d’Internet…&amp;lt;br /&amp;gt; Pour les variables numériques, les tranches doivent être identiques, et les valeurs exprimées dans la même unité statistique…&amp;lt;br /&amp;gt; Il faut s’assurer de la fiabilité des valeurs utilisées. L’utilisation de statistiques anciennes peut fausser les résultats au lieu d’améliorer leur représentativité.&amp;lt;br /&amp;gt; De même, le recours à des fichiers incomplets ou mal tenus peut provoquer des biais importants. A ce titre, les professionnels qui ont eu à gérer et à assurer la mise à jour de fichiers savent combien cette tâche est difficile et restent sur leurs gardes, alors que les autres sur-estiment généralement la qualité des fichiers qui leur sont fournis.&amp;lt;br /&amp;gt; Si l’on ne prend garde dès la phase de préparation de l’enquête à ces difficultés potentielles, on risque d’être confronté ensuite à un problème insoluble.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;Comment ça marche ?&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Les calculs de redressement sont complexes lorsqu’il s’agit de redresser l’échantillon sur plusieurs variables en même temps, comme c’est généralement le cas. Moins fréquent, le redressement sur une seule variable correspond à une simple règle de 3 : si l’on veut obtenir 55% de femmes et 45% d’hommes, alors que la répartition dans le fichier est de 40/60, il suffit d’appliquer à chaque femme le coefficient 55/40ème c’est-à-dire 1,375 et à chaque homme le coefficient 45/60ème c’est-à-dire 0,75.&amp;lt;br /&amp;gt; En présence de plusieurs variables (ex : tranche d’âge, sexe, csp), la règle de 3 peut également être appliquée si l’on connaît la distribution croisée de toutes les variables entre elles. Autrement dit, cette stratification a posteriori n’est possible que si l’on dispose d’un tableau théorique indiquant le nombre d’individus pour chaque combinaison de réponses de toutes les variables à redresser. Le rapport entre l’effectif théorique divisé par l’effectif réel constitue alors le coefficient multiplicateur à appliquer aux individus correspondants à la combinaison.&amp;lt;br /&amp;gt; Cette méthode n’est toutefois pas vraiment utilisée pour plusieurs raisons :&amp;lt;br /&amp;gt; lorsque le nombre de variables est important, l’effectif des cases peut être nul dans l’échantillon. Une règle de 3 utilisant la valeur 0 donne un effectif redressé nul.&amp;lt;br /&amp;gt; le plus souvent, on ne dispose pas de cette répartition croisée mais seulement des distributions marginales (répartition des individus sur les modalités de chaque variable).&amp;lt;br /&amp;gt; La méthode de redressement la plus utilisée part donc des répartitions marginales des individus sur chaque modalité de réponse et tente, par itérations successives, de caler l’échantillon sur ces marges. C’est pour cela qu’on parle généralement de calage sur les marges .&amp;lt;br /&amp;gt; Cette méthode fait appel à des calculs répétitifs qui ne sont pas complexes en soi mais nécessitent de nombreuses opérations. C’est pour cela que les redressements multi-critères ne s’envisagent généralement qu’avec l’aide de l’informatique. Les principaux packages statistiques du marché offrent ces fonctionnalités. Mais si certains nécessitent la mise en oeuvre de macros complexes réservées aux utilisateurs avancés, les derniers nés des outils d’analyse de données (STAT’Mania par exemple) guident l’utilisateur dans la définition des paramètres du redressement. Les étapes du redressement sont généralement les suivantes :&amp;lt;br /&amp;gt; l’utilisateur sélectionne dans la liste des variables de l’enquête, celle qui doivent faire l’objet d’un redressement,&amp;lt;br /&amp;gt; le logiciel calcule les marges sur l’échantillon en cours et les affiche,&amp;lt;br /&amp;gt; l’utilisateur indique, à côté de l’effectif calculé pour chaque modalité, l’effectif cible à obtenir.&amp;lt;br /&amp;gt; Certains outils permettent de demander une valeur totale de la population cible différente du nombre d’individus de l’échantillon, pour permettre, par exemple, d’obtenir un échantillon redressé ayant, d’une vague à l’autre, exactement le même effectif.&amp;lt;br /&amp;gt; Une fois les paramètres de redressement définis, le calcul peut être lancé. Le logiciel procède alors par itération. Il commence par chercher, pour chaque catégorie, le coefficient à appliquer pour atteindre la distribution cible. Il affecte ensuite à chaque individu, selon ses réponses à chacune des variables de redressement, une combinaison des coefficients trouvés pour les modalités qui le concernent. Cette opération est réïtérée sur la distribution obtenue, jusqu’à ce que l’effectif cible de toutes les modalités soit atteint.&amp;lt;br /&amp;gt; Mais attention : il se peut que les calculs ne permettent pas de faire converger l’échantillon interrogé vers la distribution recherchée.&amp;lt;br /&amp;gt; Ainsi, en prenant le cas extrême d’un échantillon de 100 personnes avec 50 hommes ouvriers et 50 femmes employées, il est impossible d’obtenir un échantillon cible présentant la répartition 40/60 pour les hommes/femmes et 60/40 pour les ouvriers/employés. On comprend bien dans ce cas qu’il est vain de rechercher des coefficients qui augmentent la proportion de femmes en diminuant la proportion d’employés (puisque toutes les femmes sont employées et tous les employés sont des femmes).&amp;lt;br /&amp;gt; Les redressements ne sont donc possibles (et souhaitables) qu’en tant qu’ajustements réalisés sur des échantillons ayant une certaine adéquation avec la population cible.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;Bien préparer vos données avant tout redressement&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; La technique du redressement d’échantillons est utilisée pour rapprocher le fichier de données de la réalité. Les coefficients trouvés pondèrent les données dont on dispose. Mais si ces données sont fausses dès le départ, qu’elles ont été mal collectées, mal saisies, ou qu’elles comportent trop de données manquantes, il ne servira à rien de chercher à redresser.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; Comme dans toute bonne recette de cuisine, on ne répétera jamais assez, concernant l’analyse des données, que la préparation compte autant et même peut-être davantage que la réalisation elle-même : les bons ingrédients, au bon moment, avec des accessoires adaptés, représentent là aussi la première garantie de réussite.&amp;lt;br /&amp;gt; Rappelons tout d’abord le principal objectif attendu d’une analyse des données : transformer une base d’informations, qualitatives ou quantitatives, en décisions et plans d’actions opérationnels pour un service, une entreprise, une organisation...&amp;lt;br /&amp;gt; Pour y parvenir, et quelles que soient les méthodes utilisées, des plus simples aux plus complexes, la performance de la démarche repose sur la qualité des informations qui serviront de base aux analyses. Cette qualité dépend de plusieurs facteurs :&amp;lt;br /&amp;gt; le recueil des données, en particulier selon leur origine et leur mode de collecte. Ce recueil peut reposer sur de multiples moyens, supports et processus, ce qui exigera des consolidations ou des liens entre plusieurs fichiers ayant parfois des structures différentes.&amp;lt;br /&amp;gt; la teneur des informations, en termes de types de variables (quanti/quali, brutes ou classifiées,….) mais également concernant les valeurs aberrantes, manquantes ou nulles.&amp;lt;br /&amp;gt; La phase indispensable de préparation des informations à analyser, que l’on appellera aussi nettoyage des données , dépend de plus en plus des logiciels que l’on souhaite utiliser pour effectuer les traitements. Les formats, le mode de gestion des données nulles ou absentes, les modes de calculs, répondent à certaines contraintes, qui peuvent être différentes d’un outil à l’autre. Ces éléments doivent être bien connus et anticipés si l’on veut éviter, lors du traitement, les surprises éventuelles et les erreurs de raisonnement et de calcul qui pourraient en découler.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;Les contrôles initiaux lors de l’acquisition des données&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; La meilleure manière de s’assurer que l’on dispose de données de qualité consiste à contrôler à la source, lorsque cela est possible, le processus d’acquisition et éventuellement de consolidation des données.&amp;lt;br /&amp;gt; Mais avant d’évoquer ces processus, il convient de rappeler que la qualité des données est d’abord conditionnée par la qualité du terrain. Des questions mal posées, des cibles mal choisies ou des enquêteurs mal briefés peuvent fournir des données erronées qu’il ne sert à rien de chercher à optimiser.&amp;lt;br /&amp;gt; Concernant l’acquisition elle-même, certains instituts réalisent, sur les données des enquêtes saisies en interne, une deuxième saisie (double-saisie), permettant, par comparaison des deux fichiers obtenus, de mettre en évidences d’éventuelles erreurs de recopiage de la réponse inscrite sur le questionnaire.&amp;lt;br /&amp;gt; Cette méthode est très efficace, dans la mesure où la probabilité que deux personnes différentes se trompent de la même manière, au même endroit, est très faible. Elle se justifie également lorsque la saisie est encore faite “au kilomètre”, dans des outils de saisie ne permettant pas de réaliser des contrôles avancés.&amp;lt;br /&amp;gt; Toutefois, son caractère fastidieux et long fait qu’elle est de plus en plus rarement employée, notamment par les utilisateurs finaux dans les services études des entreprises.&amp;lt;br /&amp;gt; Heureusement, les principales erreurs de frappe peuvent être considérablement diminuées par la constitution d’un masque de saisie enrichi de commandes d’auto-contrôle, liées à la nature des questions et aux modalités de réponses : des listes à choix multiples plutôt que des questions ouvertes, des échelles de minimum/maximum, un nombre fixe de positions, la saisie obligatoire, l’enrichissement contrôlé des modalités de réponses, ….. en bref une saisie contrôlée et intelligente !&amp;lt;br /&amp;gt; Les logiciels d’enquêtes moderne offrent toutes ces fonctions.&amp;lt;br /&amp;gt; Au delà des procédures de contrôle liées aux sources des informations d’autres actions sont essentielles et poursuivent cette étape, en s’intéressant directement au contenu des informations.&amp;lt;br /&amp;gt; Même si la base est alimentée de façon automatique, il est de toute manière nécessaire de réaliser des contrôles de présence et de cohérence des données. Plus la base est importante plus un développement informatique et une automatisation de cette tâche seront utiles, en contrôlant par exemple la qualité des données par des tests de distribution et des mesures de contribution de certaines valeurs.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; On peut distinguer et détailler ici trois exemples de procédures possibles :&amp;lt;br /&amp;gt; - l’identification de valeurs aberrantes&amp;lt;br /&amp;gt; - la prise en compte de valeurs manquantes&amp;lt;br /&amp;gt; - la gestion de valeurs nulles&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;L’identification de valeurs aberrantes&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Cette identification peut être réalisée principalement suivant trois méthodes :&amp;lt;br /&amp;gt; Isoler des pics de valeurs suivant une distribution statistique (pouvant masquer des saisies forcées de chiffres identiques)&amp;lt;br /&amp;gt; Définir un intervalle compris entre la moyenne et un certain nombre d’écarts types, puis limiter ou supprimer toutes les valeurs se trouvant à l’extérieur de cet intervalle : attention, on doit prêter attention à une procédure de ce type entraînant un nombre trop élevé de suppression, qui peut révéler un problème plus grave quant à la fiabilité de la base de données.&amp;lt;br /&amp;gt; Construire un score permettant, grâce à différents indicateurs statistiques, d’examiner toutes les valeurs qui contribuent à la construction de ce score. Si le niveau de contribution est anormal, on peut présupposer la présence d’une valeur aberrante à examiner plus précisément.&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;La prise en compte de valeurs manquantes&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; On peut là encore suivre 3 méthodes :&amp;lt;br /&amp;gt; La suppression des enregistrements incomplets : c’est une décision très radicale et restrictive, qui peut faire perdre un nombre élevé d’informations, par ailleurs tout à fait valables sur certains champs, alors que l’on pourrait envisager de remplacer ou de réparer ces valeurs.&amp;lt;br /&amp;gt; Le remplacement des valeurs : certains logiciels permettent de substituer une valeur absente par une valeur calculée, mais encore faut il s’accorder sur la méthode de ce choix : (moyenne, médiane, un calcul de score, ou une autre approche…. )&amp;lt;br /&amp;gt; La gestion des valeurs : certains logiciels acceptent de réaliser des calculs en l’absence de certaines valeurs, sans altérer la pertinence des traitements et des résultats, ou en les considérant comme des facteurs complémentaires d’indécision, en multipliant les cas de résolution possibles. Cela reste cependant un frein au déroulement correct de l’étude&amp;lt;br /&amp;gt; &amp;lt;br /&amp;gt; &amp;lt;b&amp;gt;La gestion des valeurs nulles&amp;lt;/b&amp;gt;&amp;lt;br /&amp;gt; Elle dépend directement du principe de calcul des logiciels ensuite utilisés, et du degré de fiabilité des traitements et des résultats que cela peut induire. Il faut cependant souligner qu’une présence trop importante de valeurs nulles ou de valeurs absentes peut en fait révéler des problèmes plus généraux, liés soit au recueil des données, au système de stockage, aux règles de contrôle, à la complexité des données elles mêmes,.. et qu’il faut veiller à remonter à la source du problème.&amp;lt;/span&amp;gt;';&quot;&gt;Si vous souhaitez en savoir encore plus sur les redressements, je vous ai trouvé un dossier encore plus complet sur les redressements ; &lt;span style=&quot;color:#0099cc; cursor:pointer&quot;&gt;cliquez ici.&lt;/span&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td id=&quot;redressements&quot; style=&quot;background-color: #e6ffe6&quot;&gt;Cliquez ci-dessus pour afficher le dossier complet&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td onclick=&quot;document.getElementById('redressements').innerHTML ='Cliquez ci-dessus pour afficher le dossier complet';&quot;&gt;&lt;span style=&quot;color:#0099cc; cursor:pointer&quot;&gt;Réduire&lt;/span&gt;&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;&lt;a target=&quot;_blank&quot; title=&quot;Dossier redressements SurveyStore&quot; href=&quot;http://www.surveystore.info/NSarticleImp/redressement-echantillons-impression.asp&quot;&gt;Dossier Via&lt;/a&gt;&lt;/p&gt;
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html</guid>
<title>La représentativité (part. I) : test d'ajustement du khi² + un cadeau</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/11/10/la-representativite-redressement-s-et-test-d-ajustement-du-k.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<category>Trucs &amp; astuces : diy</category>
<pubDate>Mon, 22 Jun 2009 08:18:00 +0200</pubDate>
<description>
&lt;p&gt;Souvenez-vous, nous avons vu (&lt;a target=&quot;_self&quot; title=&quot;Note sur le principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;ici&lt;/a&gt;) qu'un des principes des sondages est de généraliser un phénomène étudié sur un échantillon tiré d'une population à l'ensemble de cette dernière (cette généralisation est appelée &quot;&lt;b style=&quot;color: #ff9f3f&quot;&gt;inférence statistique&lt;/b&gt;&quot;). &lt;b style=&quot;color: #000000;&quot;&gt;Pour faire cette inférence statistique, l'échantillon doit être représentatif de la population étudiée&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Nous avons aussi vu (&lt;a target=&quot;_self&quot; title=&quot;Note sur le principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;ici&lt;/a&gt;) que, lorsque l'on travaille avec &lt;b style=&quot;color: #9933ff&quot;&gt;des méthodes probabilistes&lt;/b&gt;, les échantillons sont automatiquement représentatifs (pour voir en détails, différents types d'échantillon probabilistes, voir &lt;a target=&quot;_self&quot; title=&quot;Quelques échantillons probabilistes&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/01/12/les-methodes-de-sondage-part-1.html&quot;&gt;ici&lt;/a&gt;).&lt;/p&gt; &lt;p&gt;En revanche, avec &lt;b style=&quot;color: #00cc00&quot;&gt;des méthodes empiriques&lt;/b&gt;, les échantillons sont représentatifs par construction.&lt;br /&gt; Cela signifie que l'institut choisit des critères sur lesquels l'échantillon possède les mêmes caractéristiques que la population (pour voir en détail des échantillons empiriques, voir &lt;a target=&quot;_self&quot; title=&quot;Quelques échantillons empiriques&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html&quot;&gt;ici&lt;/a&gt;).&lt;/p&gt; &lt;p&gt;&amp;nbsp;&lt;/p&gt; &lt;p&gt;Alors &lt;b style=&quot;color: #000000;&quot;&gt;que se passe t-il quand on n'arrive pas à obtenir exactement le bon pourcentage sur une caractéristique dans notre échantillon par rapport à celui dans la population ?&lt;/b&gt;&lt;/p&gt; &lt;p&gt;Nous allons détailler ce cas dans un exemple pour &quot;concrétiser&quot; le raisonnement.&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #ff9f3f;&quot;&gt;Exemple&lt;/b&gt; : On mène une étude dans une entreprise comprenant 14 036 salariés.&lt;br /&gt; Ne pouvant interroger tous le monde, on décide de constituer un échantillon. N'ayant pas pu utiliser la liste de tous les salariés pour constituer un échantillon aléatoire, &lt;b&gt;nous décidons de constituer un échantillon selon la méthode des quotas et de respecter le critère du statut&lt;/b&gt;.&lt;br /&gt; 4 statuts sont historiquement utilisés dans l'entreprise pour catégoriser les employés : Cadre / Administration / Ouvriers / Commerciaux.&lt;br /&gt; Voici comment se répartissent les salariés :&lt;/p&gt; &lt;table style=&quot;margin: 5px; padding: 5px; border-collapse: collapse; background-color: white; text-align: left; height: 121px;&quot; width=&quot;218&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Catégories&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Effectifs&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;%&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Cadres&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;1 238&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;8.8%&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Administration&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;1 122&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;8.0%&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Ouvriers&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;10 948&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;78%&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Commerciaux&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;728&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;5.2%&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;Il est décidé d'interroger 300 personnes parmi les 14 036 salariés en respectant les proportions de cadres, personnels administratif, ouvriers et commerciaux. Nous devons donc interroger 300 individus comme ceci :&lt;/p&gt; &lt;table style=&quot;margin: 5px; padding: 5px; border-collapse: collapse; background-color: white; text-align: left; height: 147px;&quot; width=&quot;299&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Catégories&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Nombre à interroger :&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Cadres&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;8.8% x 300 = &lt;b&gt;26&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Administration&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;8.0% x 300 = &lt;b&gt;24&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Ouvriers&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;78% x 300 = &lt;b&gt;234&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Commerciaux&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;5.2% x 300 = &lt;b&gt;16&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;&amp;nbsp;&lt;/p&gt; &lt;p&gt;Mais, pour des raisons diverses, &lt;b style=&quot;text-decoration: underline;&quot;&gt;nous n'arrivons pas à obtenir exactement le bon nombre d'individus sur chaque classe&lt;/b&gt;. Voici ce que nous obtenons :&lt;/p&gt; &lt;table style=&quot;margin: 5px; padding: 5px; border-collapse: collapse; background-color: white; text-align: left; height: 147px;&quot; width=&quot;220&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Catégories&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey; text-align: center; text-weight: bold&quot;&gt;Nombre interrogé :&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Cadres&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;&lt;b&gt;32&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Administration&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;&lt;b&gt;30&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Ouvriers&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;&lt;b&gt;230&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;Commerciaux&lt;/td&gt; &lt;td style=&quot;margin: 5px; padding: 5px; background-color: white; border: 1px solid grey&quot;&gt;&lt;b&gt;8&lt;/b&gt;&lt;br /&gt;&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;&amp;nbsp;&lt;/p&gt; &lt;p&gt;&lt;span style=&quot;text-decoration: underline;&quot;&gt;&lt;b style=&quot;color: #000000;&quot;&gt;Que faire alors ?&lt;/b&gt;&lt;/span&gt;&lt;/p&gt; &lt;p&gt;La première chose à faire est de &lt;b style=&quot;color: #000000;&quot;&gt;vérifier si l'échantillon constitué est quand même représentatif de notre population avec le test d'ajustement du khi²&lt;/b&gt;. J'ai pu constaté que cette étape est un peu &quot;oubliée&quot; dans le monde des études au profit des redressements (que nous verrons dans une prochaine note) qui ne sont pourtant utiles que si l'échantillon n'est pas représentatif.&lt;/p&gt; &lt;p&gt;&lt;b style=&quot;color: #000000;&quot;&gt;Le principe du test d'ajustement du khi²&lt;/b&gt; : c'est le même que le fameux test de tri croisé dont vous avez peut-être déjà entendu parler à savoir &lt;b style=&quot;color: #000000;&quot;&gt;vérifier si les différences de proportions entre deux variables sont dues au hasard ou si elle résulte d'un lien entre les variables&lt;/b&gt;. Ici on veut s'assurer que les différences entre les proportions obtenues dans l'échantillon et celles de la population sont liées au hasard.&lt;/p&gt; &lt;p&gt;On ne va pas s'embeter avec les formules (pour plus de détails, achetez un bouquin de stat.).&lt;br /&gt; &lt;b style=&quot;color: #000000;&quot;&gt;En gros (attention, c'est simplifié) ce qu'il faut savoir&lt;/b&gt;:&lt;/p&gt; &lt;ul&gt; &lt;li&gt;le test du khi² va &lt;b style=&quot;color: #0099cc;&quot;&gt;calculer une sorte d'échantillon idéal&lt;/b&gt; (c'est ce que j'ai fait dans le deuxième tableau).&lt;/li&gt; &lt;li&gt;Ensuite, ce test fait &lt;b style=&quot;color: #0099cc;&quot;&gt;&quot;un score&quot; des différences entre échantillon idéal et échantillon obtenu&lt;/b&gt; (score obtenu par la formule du khi², ce score est appelé &quot;Khi²&quot;).&lt;/li&gt; &lt;li&gt;Ce &lt;b style=&quot;color: #0099cc;&quot;&gt;score va ensuite être comparé à un score théorique&lt;/b&gt; dans une table donnée (la table du khi²).&lt;/li&gt; &lt;li&gt;Si &lt;b style=&quot;color: #0099cc;&quot;&gt;le khi² calculé est supérieur au khi² théorique, cela signifie que notre échantillon obtenu est différent de ce que nous aurions dû avoir avec un échantillon &quot;parfait&quot;&lt;/b&gt; : il y a une différence significative entre échantillon constaté et échantillon théorique et cette différence n'est pas liée au hasard.&lt;/li&gt; &lt;li&gt;Dans le cas présent, on cherche à savoir si un échantillon obtenu n'est pas différent de l'échantillon théorique 'parfait'. &lt;b style=&quot;color: #0099cc;&quot;&gt;On cherche donc à avoir un khi² calculé inférieur au khi² théorique&lt;/b&gt;.&lt;/li&gt; &lt;/ul&gt; &lt;p&gt;A noter que je ne parle pas ici des degrés de liberté ou du seuil de signification pour ne pas embrouiller les esprits. J'essaierai d'en reparler en détail quand on abordera le sujet des tris croisés et du test du khi² à nouveau.&lt;/p&gt; &lt;p&gt;Pour revenir à l'exemple : en appliquant le test d'ajustement du khi² à mon exemple, je constate en fait que les différences entre mon échantillon obtenu et l'échantillon théorique 'idéal' sont liées au hasard : &lt;b style=&quot;color: #000000;&quot;&gt;mon échantillon est donc représentatif de ma population et je n'ai pas besoin de faire de redressement&lt;/b&gt;. (Pour être plus précis, mon khi² calculé est de 6.41, le khi² théorique dans la table est de 7.81, je suis en dessous et donc représentatif.)&lt;/p&gt; &lt;p&gt;&amp;nbsp;&lt;/p&gt; &lt;p&gt;Voilà pour le principe. Pour concrétiser cela, &lt;b style=&quot;color: #ff9f3f&quot;&gt;je vais vous faire un petit cadeau&lt;/b&gt; !&lt;/p&gt; &lt;p&gt;Le fichier Excel que vous pouvez télécharger ci-dessous vous servira à &lt;b&gt;faire un test d'ajustement du khi² automatiquement sur une variable comprenant jusqu'à 10 modalités&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Il vous suffit de remplir la partie de gauche avec les caractéristiques de la population puis la partie de droite avec ce que vous avez finalement obtenu lors du terrain et l'Excel vous dit instantanément si votre échantillon est représentatif ou pas. A noter qu'il faut accepter les macros.&lt;/p&gt; &lt;p style=&quot;text-align: center&quot;&gt;&lt;a href=&quot;http://lemondedesetudes.hautetfort.com/images/Test_ajustement_du_khi_deux.xls&quot;&gt;&lt;img src=&quot;http://www.clipart-fr.com/data/icones/series_02/icones_00541.png&quot; /&gt;&lt;/a&gt;&lt;br /&gt; &lt;a title=&quot;Télécharger la présentation&quot; href=&quot;http://lemondedesetudes.hautetfort.com/images/Test_ajustement_du_khi_deux.xls&quot;&gt;Télécharger l'outil (.xls)&lt;/a&gt;&lt;/p&gt; &lt;p&gt;Cliquez droit sur le lien &amp;gt; Enregistrer la cible du lien sous...&amp;nbsp; voilà !&lt;/p&gt; &lt;p&gt;Amusez-vous bien !&lt;/p&gt; 
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/12/31/le-nuage-de-mots-presenter-les-resultats-d-une-question-ouve.html</guid>
<title>Le nuage de mots : présenter les résultats d'une question ouverte</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/12/31/le-nuage-de-mots-presenter-les-resultats-d-une-question-ouve.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quali</category>
<category>Méthodologie quanti</category>
<category>Représentations visuelles, design &amp; inspirations</category>
<category>Résultats d'étude</category>
<category>Trucs &amp; astuces : diy</category>
<pubDate>Mon, 25 May 2009 08:27:00 +0200</pubDate>
<description>
&lt;p&gt;Nous &lt;a target=&quot;_blank&quot; title=&quot;Note sur brandtag&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/12/08/brandtag.html&quot;&gt;l'avions vu&lt;/a&gt; avec &lt;a target=&quot;_blank&quot; title=&quot;Brandtags&quot; href=&quot;http://www.brandtags.net/&quot;&gt;Brandtag&lt;/a&gt;&lt;a target=&quot;_blank&quot; title=&quot;Brandtags&quot; href=&quot;http://www.brandtags.net/&quot;&gt;s&lt;/a&gt;, le nuage de mot est une idée sympathique pour mettre en forme les résultats à une question ouverte.&lt;/p&gt; &lt;p&gt;Regardons cela de plus près...&lt;/p&gt; &lt;p&gt;Le nuage de mots est un moyen de représenter visuellement la prépondérance de certains mots (ou thèmes) dans un discours, sur un site Internet, dans des répondes d'individus à une question ouverte, etc.&lt;/p&gt; &lt;p&gt;Qui dit prépondérance sous-entend souvent &quot;on peut chiffrer cette prépondérance&quot;. En effet, si vous coyiez jusqu'à présent que faire un nuage de mot, c'était simplement mettre en plus gros des thèmes que vous jugez important, et bien vous aviez à la fois raison et tort.&lt;/p&gt; &lt;p&gt;Vous aviez raison car on peut faire un nuage de mot &quot;à vue de nez&quot;, rien ne l'interdit. Ainsi mettre tel mot en police 32 et en gras parce que vous pensez qu'il est très important dans le discours de(s) l'interrogé(s), c'est possible et ça sera peut-être même très intéressant pour votre présentation. Mais si c'est la situation dans laquelle vous vous trouvez, alors vous n'avez pas besoin d'outils.&lt;/p&gt; &lt;p&gt;Vous aviez tort parce que &lt;b style=&quot;color: #ff9f3f&quot;&gt;le but du nuage de mots est de rendre compte par la taille des mots de leur importance relative par rapport aux autres&lt;/b&gt; : ainsi il y a bien un calcul derrière toute cela. Un mot répété 8 fois sera plus gros qu'un mot répété 3 fois, c'est mathématique.&lt;/p&gt; &lt;p&gt;Bonne nouvelle, il existe des outils pour vous aider à faire ces nuages de mots.&lt;/p&gt; &lt;p&gt;&lt;b&gt;La référence dans ces outils est &lt;a target=&quot;_blank&quot; title=&quot;Wordle.net&quot; href=&quot;http://www.wordle.net/create&quot;&gt;Wordle&lt;/a&gt;&lt;/b&gt;. Très simple : vous tapez votre texte (votre mise à plat, votre discours, etc...) ou l'adresse d'un site web ou le del.icio.us d'une personne et ça vous sort automatiquement un nuage de mot. Le vrai interêt est que vous pouvez en plus personnaliser le nuage obtenu (couleurs, enlever des mots, sens des mots, forme du nuage, ...). Voici ce que j'obtiens par exemple en rentrant l'adresse de ce blog :&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;img src=&quot;http://lemondedesetudes.hautetfort.com/images/nuage_site.JPG&quot; /&gt;&lt;/p&gt; &lt;p&gt;Autre outil sur le web avec le même principe mais moins sympathique (je trouve) : &lt;a target=&quot;_blank&quot; title=&quot;Tagcrowd&quot; href=&quot;http://www.tagcrowd.com/&quot;&gt;Tagcrowd&lt;/a&gt;. En gros, même chose que Wordle mais avec moins de personnalisation.&lt;/p&gt; &lt;p&gt;Enfin, &lt;b style=&quot;color: #ff9f3f&quot;&gt;si vous avez fait une étude quantitative avec une question ouverte et que vous voulez faire votre nuage de mots / de thèmes pour votre présentation, il faut le faire vous-même&lt;/b&gt; !&lt;/p&gt; &lt;p&gt;Pour vous aider un petit peu, j'ai conçu &lt;b&gt;un petit outil sous Excel&lt;/b&gt;. Bon il ne fait pas tout (il ne fait pas le nuage) mais il vous donne les taille de polices à appliquer à vos mots / thèmes.&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;a title=&quot;Télécharger le fichier Excel&quot; href=&quot;http://lemondedesetudes.hautetfort.com/images/NuagedeMots.xls&quot;&gt;&lt;img src=&quot;http://www.jmreveillac.com/blog/media/excel_2003.gif&quot; /&gt;&lt;/a&gt;&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;a title=&quot;Télécharger le fichier Excel&quot; href=&quot;http://lemondedesetudes.hautetfort.com/images/NuagedeMots.xls&quot;&gt;Télécharger le fichier Excel (.xls)&lt;/a&gt;&lt;/p&gt; &lt;p&gt;Cliquez droit sur le lien &amp;gt; Enregistrer la cible du lien sous... &amp;gt; voilà !&lt;/p&gt; &lt;p&gt;Vous verrez, c'est très simple (le fichier est pré rempli avec un exemple) :&lt;/p&gt; &lt;ul&gt; &lt;li&gt;il vous suffit de &lt;b&gt;rentrer la taille de police minimale que vous souhaitez utiliser&lt;/b&gt; (d'après moi, en dessous de 8pt, c'est trop petit) et &lt;b&gt;la taille maximale de police que vous voulez faire apparaître&lt;/b&gt; dans le nuage (avec du 32pt, c'est déjà du gros, croyez moi).&lt;/li&gt; &lt;li&gt;&lt;b&gt;R&lt;/b&gt;&lt;b&gt;entrer ensuite le nombre minimum de fois qu'un mot / thème se répète&lt;/b&gt; et &lt;b&gt;le nombre maximum de fois qu'un mot / thème se répète&lt;/b&gt; (tout ça sert au calcul de la règle de trois améliorée).&lt;/li&gt; &lt;li&gt;&lt;b&gt;Rentrer vos thèmes / mots et le nombre de fois que chacun d'entre eux se répète&lt;/b&gt; et vous aurez la taille de police à appliquer à celui-ci.&lt;/li&gt; &lt;/ul&gt; &lt;p&gt;Voici, par exemple, le nuage de mots que l'outil permet de faire (avec l'exemple qui pré rempli déjà le fichier Excel). Pour info, la qualité de l'image est pas bonne car c'est un imprim écran de PowerPoint mais ça rend mieux &quot;en vrai&quot;.&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;img src=&quot;http://lemondedesetudes.hautetfort.com/images/nuage_exemple.PNG&quot; /&gt;&lt;/p&gt; &lt;p style=&quot;text-align: left;&quot;&gt;Pour cet exemple, j'ai placé les mots au hasard et ai colorié un petit peu. Mais vous pouvez aussi envisagez de colorier chaque mot, de les pencher (à la verticale, à 45°), d'ajouter un fond de couleur en dégradé, de les répartir par champs lexicaux, etc...&lt;/p&gt; &lt;p style=&quot;text-align: left;&quot;&gt;A vous de jouer !&lt;/p&gt; 
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/03/30/les-panels.html</guid>
<title>Les panels</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/03/30/les-panels.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 04 May 2009 08:12:00 +0200</pubDate>
<description>
&lt;p&gt;Nous avons vu &lt;a target=&quot;_blank&quot; title=&quot;Principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;selon quelles méthodes un échantillon pouvait être constitué&lt;/a&gt; (&lt;a target=&quot;_blank&quot; title=&quot;méthodes probabilistes&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2009/01/12/les-methodes-de-sondage-part-1.html&quot;&gt;méthodes probabilistes&lt;/a&gt; et méthodes empiriques, souvenez-vous).&lt;/p&gt; &lt;p&gt;Il nous reste cependant à voir &lt;b&gt;les panels&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Les panels sont des échantillons &quot;permanents&quot; de ménages ou d'individus (ou de magasins, ou autres) qui sont interrogés régulièrement. Les panels permettent donc de suivre l'évolution des comportements / opinions dans le temps.&lt;/p&gt; &lt;p&gt;Il existe de très nombreux panels. Plutôt que de les citer tous (non seulement ça serait long mais surtout inutile : de nouveaux apparaissent régulièrement), contentons-nous de citer &lt;b style=&quot;color: #ff9f3f&quot;&gt;les principaux types de panels qu'il existe&lt;/b&gt; :&lt;/p&gt; &lt;ul&gt; &lt;li&gt;&lt;b style=&quot;color: #006699&quot;&gt;Les panels de consommateurs&lt;/b&gt; : échantillons permanents de ménages, représentatifs de la population des ménages français. Les panélistes remplissent des questionnaires ou sont équipés d'un lecteur code-barres (solution la plus fréquente) qui renseignent sur la consommation des ménages.&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #0066cc&quot;&gt;Les panels de distributeurs&lt;/b&gt; : il s'agit cette fois de panels de points de vente de détail qui, en utilisant (le plus souvent) des lecteurs code-barres (parfois directement ceux des caisses), renseignent sur les ventes.&lt;br /&gt; Avec les panels de ditributeurs et de consommateurs, il est aisé de déterminer les fameuses parts de marché.&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #0000ff&quot;&gt;Les panels mixtes&lt;/b&gt; : ils ont pour but de &quot;mélanger&quot; les panels consommateurs et distributeurs. Très efficaces pour mesurer les effets d'actions promotionnelles (PLV, promotions sur prix de vente, etc.).&lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #333399&quot;&gt;Les panels professionnels&lt;/b&gt; &lt;ul&gt; &lt;li&gt;Les panels &lt;span style=&quot;color: #333399;&quot;&gt;gérés par une entreprise&lt;/span&gt; : certaines grandes entreprises gèrent elles-mêmes un panel de leurs clients. Une pratique qui se répend de plus en plus.&lt;/li&gt; &lt;li&gt;Les panels &lt;span style=&quot;color: #333399;&quot;&gt;gérés pour une profession&lt;/span&gt; : certaines professions disposent d'un panel propre à leur métier (panels&amp;nbsp; de l'industrie pharmaceutique).&lt;/li&gt; &lt;/ul&gt; &lt;/li&gt; &lt;li&gt;&lt;b style=&quot;color: #223399&quot;&gt;Les acces panels&lt;/b&gt; : légérement différents des autres, il s'agit en fait de très grand panel d'individus qui ont donné leur accord de principe pour répondre à une enquête s'ils sont appelés. Très pratiques pour recruter des échantillons de consommateurs d'un type particulier de produit pour une étude.&lt;/li&gt; &lt;/ul&gt; &lt;p&gt;&amp;nbsp;&lt;/p&gt; &lt;table style=&quot;border: 1px solid black; margin: auto; padding: 10px; border-collapse: collapse; height: 17px; background-color: #ffffee;&quot; width=&quot;600&quot;&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td style=&quot;text-align: center; border: 1px solid black; margin: 5px; padding: 10px;&quot;&gt;&lt;b style=&quot;color: #339966;&quot;&gt;Avantages des panels&lt;/b&gt;&lt;/td&gt; &lt;td style=&quot;text-align: center; border: 1px solid black; margin: 5px; padding: 10px;&quot;&gt;&lt;b style=&quot;color: #ff0000;&quot;&gt;Inconvénients des panels&lt;/b&gt;&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td style=&quot;text-align: left; border: 1px solid black; margin: 5px; padding: 10px;&quot;&gt;&lt;b style=&quot;color: #339966;&quot;&gt;Les panels ont l'avantage d'être très riche en informations&lt;/b&gt;. En effet, quand un individu est recrutés dans un panel, il donne de nombreuses informations personnelles qui pourront, plus tard, être croisées avec les données de l'étude.&lt;br /&gt; &lt;br /&gt; L'autre avantage des panels est &lt;b style=&quot;color: #339966;&quot;&gt;la possibilité de faire des mesures d'évolutions très précises&lt;/b&gt;.&lt;/td&gt; &lt;td style=&quot;text-align: left; border: 1px solid black; margin: 5px; padding: 10px;&quot;&gt;Les panels ont en revanche pour problèmes &lt;b style=&quot;color: #ff0000;&quot;&gt;d'être relativement complexes et couteux à constituer&lt;/b&gt;. Il faut en effet trouver des individus prêts à participer.&lt;br /&gt; &lt;br /&gt; En plus de cela, les panélistes, souvent amenés à se prononcer sont soumis à un &lt;b style=&quot;color: #ff0000;&quot;&gt;&quot;effet panel&quot;&lt;/b&gt;. En clair, les panélistes sont de plus en plus conditionner à répondre à des enquêtes... et sont mêmes de plus en plus enclins à conditionner leurs achats pour les rationnaliser.&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; &lt;p&gt;A noter que pour limiter &quot;l'effet panel&quot; et éviter de fausser les résultats des études réalisées, &lt;b style=&quot;color: #000000;&quot;&gt;les panels sont renouvelés à hauteur de 20% environ tous les ans&lt;/b&gt;.&lt;/p&gt; 
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/03/30/comment-choisir-le-graphique-a-faire.html</guid>
<title>Comment choisir le graphique à faire ?</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/03/30/comment-choisir-le-graphique-a-faire.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<category>Trucs &amp; astuces : diy</category>
<pubDate>Mon, 30 Mar 2009 08:34:00 +0200</pubDate>
<description>
&lt;p&gt;Vous le savez, le &lt;b&gt;principe d'un graphique est de rendre compte visuellement d'une certaine quantité de données&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Mais parfois, devant tous les types de graphiques qu'Excel (ou un autre programme) ainsi que ceux que vous imaginez spontanément, il est courant de rester un peu... dubitatif.&lt;/p&gt; &lt;p&gt;Voici une petite aide pour bien choisir votre graphique (trouvée sur le site &lt;a target=&quot;_blank&quot; title=&quot;Article sur as-map&quot; href=&quot;http://as-map.com/blog/index.php/2009/01/19/diffrent-type-de-presentations-pour-des-objectifs-differents/&quot;&gt;As-map&lt;/a&gt;) :&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;object height=&quot;355&quot; width=&quot;425&quot; codebase=&quot;http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0&quot; classid=&quot;clsid:d27cdb6e-ae6d-11cf-96b8-444553540000&quot;&gt;&lt;param name=&quot;allowFullScreen&quot; value=&quot;true&quot; /&gt; &lt;param name=&quot;allowScriptAccess&quot; value=&quot;always&quot; /&gt; &lt;param name=&quot;src&quot; value=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=choosingagoodchart09-1232616818764035-1&amp;amp;stripped_title=choosing-a-good-chart-09-presentation&quot; /&gt; &lt;embed height=&quot;355&quot; width=&quot;425&quot; src=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=choosingagoodchart09-1232616818764035-1&amp;amp;stripped_title=choosing-a-good-chart-09-presentation&quot; allowscriptaccess=&quot;always&quot; allowfullscreen=&quot;true&quot; type=&quot;application/x-shockwave-flash&quot; /&gt;&lt;/object&gt;&lt;/p&gt; &lt;p&gt;Et le &lt;a target=&quot;_blank&quot; title=&quot;Pdf original&quot; href=&quot;http://extremepresentation.typepad.com/files/choosing-a-good-chart-09.pdf&quot;&gt;PDF d'origine est ici&lt;/a&gt;.&lt;/p&gt; &lt;p&gt;Si vous voulez vous &quot;éloignez&quot; un peu des graphiques traditionnels et faire des illustrations informatives plus personnelles (des minis infoviz en quelques sortes), voici une petite présentation qui vous aidera (un peu) :&lt;/p&gt; &lt;p style=&quot;text-align: center;&quot;&gt;&lt;object height=&quot;355&quot; width=&quot;425&quot; codebase=&quot;http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0&quot; classid=&quot;clsid:d27cdb6e-ae6d-11cf-96b8-444553540000&quot;&gt;&lt;param name=&quot;allowFullScreen&quot; value=&quot;true&quot; /&gt; &lt;param name=&quot;allowScriptAccess&quot; value=&quot;always&quot; /&gt; &lt;param name=&quot;src&quot; value=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=thinkviz-1232315653281316-3&amp;amp;stripped_title=thinking-visually-presentation&quot; /&gt; &lt;embed height=&quot;355&quot; width=&quot;425&quot; src=&quot;http://static.slideshare.net/swf/ssplayer2.swf?doc=thinkviz-1232315653281316-3&amp;amp;stripped_title=thinking-visually-presentation&quot; allowscriptaccess=&quot;always&quot; allowfullscreen=&quot;true&quot; type=&quot;application/x-shockwave-flash&quot; /&gt;&lt;/object&gt;&lt;/p&gt; &lt;p style=&quot;text-align: left;&quot;&gt;Sans oublier que vous pourrez trouver des idées sur &lt;a target=&quot;_blank&quot; title=&quot;Visual complexity&quot; href=&quot;http://www.visualcomplexity.com/vc/&quot;&gt;Visualcomplexity&lt;/a&gt; et sur &lt;a target=&quot;_blank&quot; title=&quot;As-map&quot; href=&quot;http://as-map.com/blog/&quot;&gt;As-map&lt;/a&gt;.&lt;/p&gt; 
</description>
</item>
<item>
<guid isPermaLink="true">http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html</guid>
<title>Les méthodes de sondage (part. 2)</title>
<link>http://lemondedesetudes.hautetfort.com/archive/2009/02/09/les-methodes-de-sondage-part-2.html</link>
<author>noreply@hautetfort.com (Grégoire Hervé-Bazin)</author>
<category>Méthodologie quanti</category>
<pubDate>Mon, 09 Mar 2009 08:42:00 +0100</pubDate>
<description>
&lt;p&gt;Nous l'avons vu (Note : &quot;&lt;a target=&quot;_self&quot; title=&quot;Note sur le principe du sondage&quot; href=&quot;http://lemondedesetudes.hautetfort.com/archive/2008/11/26/mesurer-un-phenomene-dans-une-population-le-principe-du-sond.html&quot;&gt;Le principe du sondage&lt;/a&gt;&quot;), il existe deux grandes familles de méthodes de sondage : les &lt;b style=&quot;color: #9933ff&quot;&gt;méthodes probabilistes&lt;/b&gt; et les &lt;b style=&quot;color: #00cc00&quot;&gt;méthodes empiriques&lt;/b&gt;&lt;br /&gt; Nous avons déjà détaillé les méthodes probabilistes dans la note &quot;Les méthodes de sondage (part. 1)&quot;, voici donc le moment de se pencher d'un peu plus près sur les &lt;b style=&quot;color: #00cc00&quot;&gt;méthodes empiriques&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;&lt;span style=&quot;border: 1px dotted black; padding: 5px; display: block; width: 90%; background-color: #ffffd2;&quot;&gt;&lt;b style=&quot;color: #ff9f3f&quot;&gt;Petit rappel nécessaire :&lt;/b&gt; on dit qu'un échantillon est constitué selon une méthode empirique quand on ne connaît pas à priori la probabilité de chaque individu de la population concernée d'appartenir à l'échantillon. Quand il n'existe pas de liste de sondage de la population (cas très courant), on a donc recours aux méthodes empiriques.&lt;/span&gt;&lt;/p&gt; &lt;p&gt;Avant de regarder plus précisemment quels sont les principales méthodes empiriques, on peut constater que ces méthodes ont l'&lt;b style=&quot;color: #ff9f3f&quot;&gt;avantage d'être moins chères que les méthodes probabilistes&lt;/b&gt;.&lt;/p&gt; &lt;p&gt;Voici les principales méthodes empriques de sondage :&lt;/p&gt; &lt;ul&gt; &lt;li&gt;La première méthode probabiliste est la &lt;b style=&quot;color: #006699&quot;&gt;méthode des quotas&lt;/b&gt; : à partir de caractéristiques de la poplation qu'on connaît, on va constituer un échantillon qui conservera les mêmes caractéristiques. C'est la méthode la plus utilisée en France.&lt;br /&gt; Le principe est simple : on suppose que si, comme dans la population, notre échantillon comporte XX% de femmes, AA% d'hommes, BB% de cadres, YY% d'individus de la région Lorraine, etc., il se comportera comme le ferait les individus de la population en général sur les questions que l'on souhaite étudier. On va donc pouvoir généraliser les réponses que l'on mesure à la population.&lt;br /&gt; Quelques règles à retenir dans la pratique des quotas : les quotas doivent être faciles à identifier, ne doivent pas être trop nombreux et il faut que les variables sur lesquels on applique des quotas soient liées au problème étudié.&lt;br /&gt; &lt;br /&gt;&lt;/li&gt; &lt;li&gt;Une autre méthode probabiliste est le &lt;b style=&quot;color: #0066cc&quot;&gt;sondage auprès de volontaires&lt;/b&gt; : il s'agit tout simplement de demander à des individus de répondre (par exemple : auprès de lecteurs d'un journal).&lt;br /&gt; &lt;br /&gt;&lt;/li&gt; &lt;li&gt;La méthode de l'&lt;b style=&quot;color: #0000ff&quot;&gt;échantillonage sur place&lt;/b&gt; : on interroge les individus sur le lieu d'achat ou d'activité par exemple. Avec cette méthode, il faut particulièrement faire attention à la disposition des lieux (ne pas interroger toujours au même endroit, ne pas interroger que les individus sortant du lieu, etc.) et aux moments d'enquêtes.&lt;br /&gt;&lt;/li&gt; &lt;/ul&gt; 
</description>
</item>
</channel>
</rss>