Et ouais ! Comment Google arrive-il à trouver en un temps record exactement ce que je recherche ? Et comment Amazon arrive-t-il à devinez les livres qui m’intéressent ?
Moi je sais ! Et vous ?
Si vous savez, passez par la case départ, prenez vos 20.000 Francs (ou 200 euros) et revenez la semaine prochaine 🙂
Donc, pour ceux qui ne savent pas, je vous conseille vivement la lecture de Programming Collective Intelligence. Ce livre explore et vous explique en profondeur quelques-uns des algorithmes les plus utilisés dans les site Web 2.0.
Vous trouverez donc dans ce livre un chapitre intitulé Making Recommandations qui vous explique comment les meilleurs sites Web 2.0 arrivent à savoir, en fonction de ce que vous leur avez dit que vous aimiez, ce qui pourrait vous plaire. Grâce aux algorithmes expliqués, vous comprendrez mieux comment Amazon vous recommande des articles, ou ce qui fait le succès de sites comme last.fm ou iLike.com.
Ce livre traite également des moteurs de recherche dans le chapitre Searching and Ranking. L’algorithme PageRank, sur lequel Google a bâti son empire, y est expliqué en détail. J’ai également appris dans ce chapitre comment utiliser des réseaux neuronaux pour améliorer les résultats d’une recherche en fonction des liens qui sont cliqués par les utilisateurs.
Un autre sujet qui m’a passionné dans ce livre concerne le filtrage de document. L’auteur détaille plusieurs algorithmes de classification, notamment le très célèbre fitrage bayésien qui sert à déterminer si un email est un spam ou pas.
Enfin, un autre chapitre qui m’a beaucoup intéressé, c’est celui traitant des modèles de prix. Ce chapitre explique comment déterminer le prix d’un article en fonction de ses caractéristiques quand on connait le prix d’autres articles. A la fin du chapitre, on utilise l’API de eBay pour connaitre le prix final d’enchères concernant des ordinateurs portables et pour prévoir le juste prix d’enchères en cours. En jouant avec le programme, je me suis ainsi rendu compte que les variables les plus importante sont la taille de l’écran du portable et… la date de fin d’enchère !
Bref ce livre est vraiment génial. L’auteur utilise tout au long du livre la même technique pédagogique qui permet de bien comprendre chaque sujet abordé:
- D’abord fixer un objectif (par exemple, connaitre la liste des films qui sont susceptible de me plaire)
- Ensuite décrire et expliquer l’algorithme qui permet d’atteindre cet objectif
- Enfin la réalisation d’un petit programme en Python illustrant le concept et permettant de jouer sur les différents paramètres de l’algorithme étudié. Si vous ne connaissez pas Python, c’est une bonne occasion pour s’y mettre !
En conclusion, si vous œuvrez dans le monde du Web 2.0, ou si vous êtes juste curieux de nature, procurez-vous ce livre d’urgence.