EMI 3ème La recherche d’information sur le Web: les moteurs de recherche

Je dois avouer que ce billet est en brouillon depuis presque un an. Je prends à peine le temps de le terminer, et de trouver peu à peu le temps et l’envie de publier par ici.

Pour recontextualiser: depuis la rentrée dernière, j’ai les élèves de 3ème, en classe entière pour des séances d’EMI à l’année, une heure par quinzaine. L’an passé, j’ai pu expérimenter quasi toutes les séances prévues (voir ici) avec toutefois quelques suppressions / modifications.

Cette première séquence a été précédée, l’an dernier, d’une introduction sur les aspects historiques d’Internet et du Web, et ce qu’ils sont. En effet les 3ème que j’ai eu en 2020/2021 n’avaient pas eu de séances EMI en 5ème, et nous n’avions pas abordé ces aspects ensemble. Je ne m’attarde pas trop sur ce propos introductif qui reprend dans les cadres lignes la première séance en 5ème. Ceci dit, je n’ai pas vraiment pris le temps de revenir sur ces notions / connaissances avec les 3ème de cette année (qui avaient eu EMI avec moi en 5ème), pensant naïvement que c’était acquis et je me rends compte que c’est une erreur: ils ont tout oublié, donc il faut vraiment prévoir un temps pour revenir dessus, et vérifié si les élèves ont bien assimilé la chose. Je m’appuie sur la vidéo de révision que j’avais mise en ligne l’an dernier.

Je vous glisse le document distribué aux élèves de 3ème ci-dessous.

Cette séquence autour de la notion de moteur de recherche est constituée de trois composantes: le fonctionnement général d’un moteur de recherche (séance 1), interface et page de résultats (séance 2), le monopole Google (séance 3). Elle est ponctuée par une évaluation de fin de séquence.

La construction de cette séance repose en premier lieu sur l’article de Julien Rousseau Le moteur de recherche et les collégiens : quelles représentations, quels obstacles, quelle didactisation ? sur le site les Trois Couronnes. La partie fonctionnement d’un moteur de recherche est grandement inspirée de la séance proposée par Gaëlle Sogliuzzo Comment fonctionne un moteur de recherche : l’exemple de Google. En parallèle, j’ai eu la chance, dans le cadre de mon master l’an passé (Le master 2 MEEF EMI à Toulouse 🙂 – Big up à Nicole Boubée et son équipe et à mes copines de promo!) de suivre le cours de Guillaume Sire sur les moteurs de recherche, ce qui vous en convenez, tombait parfaitement! Son ouvrage (Sire, Guillaume. Les moteurs de recherche. La Découverte, 2016) est à lire!

Les séances se déroulent au CDI (l’an passé c’était CDI / salle de classe, protocole sanitaire oblige). La troisième séance (sur Google) est la même que l’an passé et présente un côté trop magistral, mais je n’ai pas eu le temps de la reprendre. Ça viendra.

Séance 1 : Le fonctionnement général d’un moteur de recherche

Cette séance est donc inspirée de celle présentée par Gaëlle Sogliuzzo. J’ai d’ailleurs repris le schéma proposé dans sa séquence.

La séance est introduite par un rappel sur la distinction entre navigateur et moteur de recherche.

Ensuite, les élèves réalisent une petite activité qui consiste à effectuer une recherche, sur le moteur de recherche de leur choix, ayant pour sujet « Comment fonctionne un moteur de recherche? ». Dans un premier temps il s’agit seulement de saisir sa requête et d’accéder à la page de résultats.
Nous nous regroupons ensuite pour une mise en commun: quel outil a été utilisé? (réponse attendue navigateur puis moteur de recherche). Quel navigateur et moteur de recherche avez-vous choisi (Google l’emporte). On liste au tableau les requêtes saisies par les élèves. Même en 3ème, la tendance à saisir la question du sujet dans la barre de requête est majoritaire. On questionne les différentes requêtes proposées: peut-on trouver des synonymes? Est-on obligé de saisir la question entière ? Les caractères saisis sont-ils accentués? On évoque ensuite la notion de mots-clés: le moteur de recherche comprend-il le sens des mots? Le langage humain? Ces questions orientées permettent de faire évoluer la notion de mots-clés vers celle de chaînes de caractère sur un moteur de recherche.

Une autre activité est alors proposée aux élèves, toujours sur le même sujet de recherche. Plusieurs requêtes leurs sont proposées (voir fiche élève): pour chacune, ils doivent renseigner le nombre de résultats obtenus et si cette option figure sur le moteur de recherche choisi, le temps indiqué par celui-ci pour proposer une liste de résultats.

  • Comment fonctionne un moteur de recherche
  • Fonctionnement moteur de recherche
  • « Fonctionnement moteur de recherche »
  • Fonctionement mauteur de recherche

Nous nous retrouvons à nouveau pour comparer les résultats obtenus. Il s’agit de préciser à nouveau que le moteur de recherche traite notre saisie en tant que chaîne de caractères. La question suivante leur est soumise: Que fait le moteur de recherche de cette chaîne de caractère, entre le moment où nous validons la requête et l’affichage des résultats? Les propositions des élèves font l’objet d’une discussion, nous notons au tableau certains éléments proposés.

Sur la fiche élève, nous observons alors de plus près les trois modules qui composent le moteur de recherche et nous expliquons le rôle de chacun (schéma au tableau, questions / réponses):

  • Le module d’exploration: les spiders / crawlers ou encore bots, sont des logiciels qui explorent le Web en passant par les liens hypertextes entre les pages. Ils enregistrent des copies de ces pages (copie de certains éléments seulement dans la plupart des cas) et les envoient au module d’indexation
  • Le module d’indexation: il liste les chaînes de caractère présentes dans ces copies de pages, les stocke et les organise dans un index / base de donnée.
  • Le module d’interrogation: il s’agit de l’interface du moteur de recherche, face à laquelle un internaute est confronté. Il s’agit de l’interface entre l’internaute et l’index. Le module d’interrogation code la requête en chaîne de caractères, la compare au contenu de l’index et affiches les résultats correspondants.

Séance 2 : La page de résultats d’un moteur de recherche

En préambule, il s’agit de revenir sur la séance précédente: je demande aux élèves de me citer les trois modules qui composent un moteur de recherche et de les décrire rapidement. On commence avec les portes-vue fermés. Si je vois que ça coince, ils reprennent la fiche du cours précédent et ça débloque la situation.

Je rappelle l’objectif de la séance (analyse de l’interface et d’une page de résultat d’un moteur de recherche) et je détaille l’activité: il s’agit pour les élèves (par groupe de 2 ou 3) de choisir un moteur de recherche et d’observer son interface: l’interface est-elle simple ou éditorialisée? Y trouve t-on un bouton de connexion de type « Mon compte »? Un menu ? Une rubrique « à propos » « qui sommes- nous »? D’autres éléments (je pense par exemple au compteur d’arbres plantés sur Ecosia)?

Puis, les élèves sont invités à formuler la requête « masque lavable » (voilà les exemples choisis!) et à l’aide du questionnaire de la fiche d’activité, ils observent la première page de résultats.

Nous nous retrouvons une fois l’activité terminée. Pendant le temps de l’activité, j’ai ouvert dans des onglets différents les différentes interface des moteurs de recherche proposés, ainsi que les pages de résultats pour « masque lavable ». Il s’agit ensuite de reprendre avec les élèves les différents éléments qu’il fallait observer durant l’activité:

  • Les suggestions de recherche au moment de la saisie de la chaîne de caractères composant la requête: Lorsqu’un internaute saisit sa requête, le moteur de recherche peut lui suggérer plusieurs requêtes (déjà formulées par des internautes).
  • liens simples / liens enrichis:
    • Liens simples: le lien généré par le moteur apparait en bleu, suivi d’une description en noir.
    • Liens enrichis: les liens peuvent être enrichis avec une image, une indication de notation (pour un restaurant par exemple)…
  • liens naturels / liens sponsorisés:
    • Liens naturels: Un lien naturel est un lien référencé « naturellement » par le moteur de recherche
    • Liens sponsorisés: On parle aussi de liens commerciaux. Ils apparaissent la plupart du temps sous la même forme que les autres liens, mais dans des encarts spécifiques (en haut, à droite de la page des résultats…). Lorsque l’internaute clique sur un lien sponsorisé, cela entraine un paiement de l’éditeur du site au propriétaire du moteur de recherche.
  • les moteurs de recherche spécialisés : Les moteurs spécialisés sont consacrés à un type de documents spécifiques (actualités, shopping, Maps…) ou à un format d’information (images, vidéos…). Consultables indépendamment, ils sont aujourd’hui directement intégrés au moteur généraliste: ainsi, sur une page de résultats, on trouvera des liens  issus de ces moteurs spécialisés (images, vidéos, maps, actualité etc…). On aperçoit le lien vers ces moteurs via les « catégories » visibles sous la barre de requête et/ou directement dans la page de résultats.

Séance 3: Le monopole Google

Cette séance est celle qui présente le plus une dimension « magistrale » puisque je l’avais mise en place l’an dernier, alors que le protocole sanitaire exigeait que les enseignants se déplacent dans la salle attribuée à chaque classe. Cependant, chaque diapositive du diaporama permet d’ouvrir à la discussion avec les élèves et je les invite à participer par le biais de questions / réponses auprès du groupe.

Il s’agit, pour cette séance, de considérer Google en tant qu’entreprise et non pas seulement en tant que moteur de recherche. Et de questionner la place monopolistique que Google a su mettre en place et de questionner les problématiques éthiques induites. On abordera également le modèle socio-économique de Google, son modèle économique et la question des données personnelles.

Le diaporama est disponible ci-dessous (au format .pptx et .pdf), mais voici dans les grande ligne les déroulé et contenu de la séance.

Avant de commencer, je demande aux élèves s’ils connaissent Google (Oui, forcément) et si certains n’ont jamais utilisé Google ou de services de Google (jusque là, aucun élève ne m’a répondu non). J’évoque le fait qu’au fondement Google n’était qu’un moteur de recherche créé à la fin des années 1990, mais qu’aujourd’hui il s’agit d’une entreprise, proposant un ensemble de services, et occupant une place de quasi monopole à l’échelle mondiale au niveau des services de recherche d’information et de communication depuis les années 2010. J’évoque le terme de monopole en leur demandant dans un premier temps s’ils peuvent me définir le terme. Si les conditions sont réunies, ils peuvent aller chercher la définition dans un dictionnaire.

Monopole, définition du Larousse

Privilège (de droit ou de fait) dont dispose un individu, une entreprise ou un organisme public de fabriquer ou de vendre seul certains biens ou certains services à l’exclusion de tout concurrent.

Nous commençons par parler de la stratégie de diversification de Google. Celle-ci passe par des acquisitions et le développement interne d’outils / services. Je leur propose pour chaque catégorie de me dire s’ils connaissent des services/ entreprises / startups qui auraient été achetés par Google et d’autres qu’ils auraient développés au fur et à mesure (voir diaporama). Une fois la liste établie, on fait un focus sur le projet avorté des Google glasses et après le visionnage de la vidéo (ci-dessous), nous prenons un moment pour en discuter.

Il s’agit ensuite de questionner cette stratégie de diversification: qu’est-ce qu’elle apporte à Google? Nous pouvons alors aborder la question épineuse de la récolte des données personnelles des usagers, notamment des individus identifiés (et qui ont donc créé un compte Google). Ces données personnelles permettent à Google d’améliorer les performances et l’attractivité de son moteur de recherche et de ses services, et de proposer des stratégies publicitaires ciblées. Nous reviendrons par la suite sur le modèle économique de Google.

Puis nous revenons rapidement sur l’histoire de Google: sa date de création (4 septembre 1998) et ses créateurs: on peut montrer aux élèves la première interface du moteur de recherche et la comparer à l’interface actuelle. Nous mettons en avant quelques dates clés: essor de la stratégie de diversifications dans les années 2010, apparition de la publicité dès 2002, et la date qui marque la restructuration de Google, 2015, avec la naissance de la société mère Alphabet. Les différents services sont alors répartis au sein de différentes filiales.
L’évocation de la société mère et de ses filiales permet d’introduire du vocabulaire spécifique au monde de l’entreprise et nous définissons ces deux termes.

Filiale

entreprise qui est contrôlée par une autre société dite société mère

Nous arrivons ensuite à une partie qui nous intéresse particulièrement: il s’agit du modèle économique de Google qui est en lien avec le choix de l’inclusion de la publicité dans ses services. Nous revenons rapidement sur les aspects historiques liés à la publicité sur le Web, et je leur montre la toute première bannière publicitaire apparue en 1994. Au début de l’Internet et du Web « grand public », la question de la possibilité de monétiser les contenus et services se multipliant sur le Web s’est vite posée.  La publicité était alors majoritairement présente sous forme de bannière publicitaire, parfois pop-up (qui apparaissaient de façon impromptue). Ce système de bannière était finalement proche du modèle publicitaire traditionnel, qui consistait en l’achat d’encart / emplacement par l’annonceur sur un média (un encart dans un journal papier, un encart à la TV, un spot radio, ou un emplacement sur un site Web).

Puis nous évoquons Bill Gross. A la fin des années 90, Bill Gross, un des pionniers de la Silicon Valley, et créateur du moteur de recherche « Go to », imagine un modèle économique basé sur l’insertion de publicité sur les moteurs de recherche. Auparavant, d’autres modèles basés sur la publicité ont été imaginés mais ont fait un flop: exemple avec le moteur de recherche Infoseek, qui a tenté de vendre des abonnements à 9,99 par mois pour 100 requêtes et une facturation à 0,10 cts par requête supplémentaire (échec face à la concurrence des moteurs de recherche gratuits).

A ce moment là, il est important d’évoquer le fait que l’insertion de publicités sur le moteur de recherche Google était alors non envisagée par ses créateurs, à l’aide de la citation suivante

Sergueï Brin et Larry Page ,1998

les concepteurs de technologies « seraient fortement incités à travailler pour les annonceurs plutôt que pour les besoins de leurs utilisateurs » en faisant le choix d’un modèle économique basé sur la publicité. 

Sauf qu’en 2002, S. Brin et L.Page revoient leur copie car il faut réfléchir à un modèle économique pour leur moteur de recherche s’ils souhaitent que celui-ci perdure et se développe. Même s’ils refusent une association / fusion avec Bill Gross, ils reprennent ses deux principes et en ajoute un troisième (séparation liens naturels / liens sponsorisés) qui leur permet d’éviter les controverses / critiques nourries à l’égard de Bill Gross. La machine de l’activité publicitaire sur Google est lancée, et elle ne se fera que croître…

Nous essayons d’éclaircir les deux principes établis par Bill Gross: l’achat de mots-clés et la facturation au coût par clic.

Pour conclure, nous interrogeons cette place monopolistique que Google a su développer et conserver. J’évoque rapidement avec eux la notion de cout d’opportunité et la problématique liée aux données des utilisateurs avec la mention des Query Logs. Il s’agit ici vraiment d’aborder très furtivement ces aspects, pour leur faire prendre conscience des problématiques soulevées par le monopole Google, et nous prenons bien entendu un moment pour en discuter.

  • Coût d’opportunité: le coût que devrait supporter un utilisateur ou un partenaire s’il venait à changer de service
    • Pour l’utilisateur: s’habituer à un autre agencement des fonctionnalités
    • Pour les éditeurs: devoir mettre en place des partenariats avec un autre moteur, l’implémenter, comparer la rémunération…
    • Pour un navigateur: aspect technique, satisfaction des utilisateurs…
  • Query Logs: historique des données de Google depuis 1998

Évaluation de fin de séquence

Je clôture cette séquence par une évaluation écrite sur ces trois séances. Il s’agit aussi d’évaluer la connaissance et compréhension des notions d’Internet et du Web.

Je vous propose ici plusieurs formats pour cette évaluation: l’évaluation « classique » (je m’excuse mais ce sera un pauvre scan de mon fichier, car je ne retrouve plus sa version numérique) , celle que j’ai adaptée (à venir) pour les élèves de Segpa, d’Ulis ou UPE2A ayant encore quelques difficultés avec la langue française, ou tout élève présentant un trouble de la compréhension et de l’écriture et qui aurait besoin d ‘une adaptation de l’évaluation (pour écrire le moins possible). Cette année j’ai également conçue une version en anglais de cette évaluation – à venir- (et des fiches de cours – à venir et à retrouver en fin de billet et merci DeepL-) car j’ai deux élèves UPE2A qui sont arrivés il y a quelques semaines à peine, qui ont encore beaucoup de mal avec le français mais qui sont clairement motivés par les séances d’EMI et je trouvais dommage de les mettre en difficulté. L’évaluation est notée, sur 20.

Concernant les compétences évaluées, voici un petit listing:

  • compétence numérique (CN5 2.6) Prendre conscience de l’évolution des matériels et des logiciels pour développer sa culture numérique. Ici il s’agit de situer l’apparition d’Internet et du Web et de différencier Internet et le Web. (CN5 2.10) Connaître les grandes lignes des modèles économiques du numériques
  • Socle commun : Domaine 2 (5.2) Comprendre des consignes (11.1) Apprendre le cours

Les documents en version anglaise

Publicité

2 réflexions sur “EMI 3ème La recherche d’information sur le Web: les moteurs de recherche

  1. Pingback: Progression EMI 3ème 2020-2021 | Doc à bord

  2. Pingback: EMI 3ème La recherche d’informatio...

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s