Cours Audrey Open Edition : Différence entre versions

Version du 14 janvier 2016 à 11:12

Marin Dacos - directeur du centre pour l'édition électronique ouverte. Architecte des systèmes d'information - chercheur au CNRS. Parcours à la croisée de plusieurs disciplines : histoire - informatique - sciences humaines - édition

Présentation d'un point de vue professionnel d'Open Edition (marque déposée) (anciennement IBM) = idée tirage illimité (on fait autant de tirage que nécessaire grâce au numérique) Il s'agit d'un nouveau paradigme. Paradigme historique de l'édition/presse : celui de la rareté. Le bien est rare, plusieurs personnes en concurrence pour l'avoir, en jouir, le posséder. Le bien que je perds est un bien rival (je le donne je le perds) Grâce au numérique, la rareté n'est plus de mise, nous entrons dans une autre économie, celle de l'attention. C'est l'attention du public qui devient rare du fait de la profusion de documents disponibles sur Internet. (quand je donne le bien je ne m'en dépossède pas, biens non rivaux) : Chance historique.

Différentes modèle économiques

Modèle du péage pour reproduire artificiellement de la rareté choisi par certaines presses. Ne fonctionne pas, réduit le lectorat. Obligation d'inventer de nouveaux modèles économiques. Exception Médiapart (mais pour le moment seulement !), ils sortent des affaires, font du buzz et donc créent de la rareté et des abonnements.

Modèles économiques hybrides choisis par Libé, le Figaro... : accès abonnés pour une partie du contenu et une autre partie en accès ouvert. Mais revenu insuffisant pour faire vivre de tels grands groupes de presse.

Modèle freemium : je peux jouer et gagner sur un jeu en ligne par exemple. C'est une expérience complète mais non intense Ex : Dropbox. Toutes les fonctionnalités dispo gratuitement avec 2 Gigas , mais donc espace limité. Pari qu'entre 5 et 8% pourraient passer potentiellement au modèle premium pour obtenir stockage supplémentaire. Skype au départ était freemium (dès que plus de 2 utilisateurs en visioconf, passer en payant)

Interêt initial : faire que les lecteurs nous lisent; Ensuite, passer au freemium. Mais comment ? le cookie du New York Times qui comptabilise le nombre d'articles lus et bloque l'accès aux internautes au bout d'un certain nb de lecture gratuites en ligne. Mais très faiblement coercitif. Logique B2C (business for consumers). Il suffit qu'on change de session pour avoir un accès de nouveau. Le coût de transaction = le coût matériel, le temps que je passe à faire une transaction avec qqun.

Ici le CNRS est dans une logique B2B en s'adressant aux bibliothèques universitaire. Ils considèrent que l'usage intensif est liés aux professionnels. On va donc créer des services pour ces professionnels. Ils ont donc décidé de ne pas vendre de contenus, mais de vendre des services. Les cibles sont donc les chercheurs qui aiment créer des bibliothèques. Dans le numérique, ils ont envie d'avoir le livre ou la revue dans leur disque dur. A la fois pour l'annoter, ensuite pour pouvoir l'emporter partout sans forcément avoir de connexion Internet. Le CNRS leur vend donc des fichier PDF ou EPUB. Pour les télécharger il faut donc être abonné. D'autres services comme les statistiques sont également payants. .

4 plateformes : revues.org, calenda, hypothèses (carnet de recherches, blogs de chercheurs), OpenEdition Books

Histoire de l'édition

Wikipédia (années 2000) modèle le plus achevé d'édition éléctronique 1971 : projet Gutemberg. un étudiant à qui on prête un ordinateur et qui tape la déclaration d'indépendance des USA en ASCII . Ce projet existe toujours. 1949 : père Roberto Busa (ecclésiastique italien) qui s'associe avec IBM. Fait des études sur Saint Thomas d'Aquin et fait un Index Thomisticus (30 ans, 56 volumes édités)

trois temps qui cohabitent dans l'édition numérique :

Temps 1 = numérisation (ex : projet Gallica de la BNF ou Google Books = un gigantesque programme de numérisation du savoir humain) text mining ou fouille de texte = on essaie de sortir du texte des informations, possible qu'après avoir numérisé le texte (par exemple, la langue du texte). Google fouille des textes par exemple. Le plus connu en fouille de texte c'est Google Ngram grâce à de la ROC (reconnaissance optique de caractère, en anglais OCR). Ensuite il propose de chercher la fréquence d'un terme. mais on ignore ce que contient le corpus. OpenEdition Lab : création de l'outil Bilbo. On lui dit comment on comprend une référence et on lui fournit 3000 références de départ qui servent d'apprentissage. 400 000 docs. Revues comme Persee.fr et Jstor.org qui fournissent aussi des publications en lignes avec recherches

Temps 2 : édition nativement numérique. . Milieu des années 1980. Elle utilise les éditions numériques dès le début. Passe par la PAO. What you see is what you get (WYSIWYG) permet de voir le rendu graphique immédiatement ce qui n'était pas le cas auparavant (il fallait coder les termes en gras...) le code est indispensable si l'on ne veut pas se faire maîtriser par lui (données cachées sous word par exemple qui gonflent le volume du fichier) sorte de palimpseste, attention, on peut donc parfois revenir sur les versions effacées et retrouver le texte que nous avions choisi de gommer. cf support Dominique ROUX : en devenant numérique, l'édition n'est plus mono support. Avec le multisupport, intervient le pbm des ruptures de charge dans le workflow (= circuit de traitement, de l'auteur au livre final. ) On essaie de réduire ces ruptures de charge (comme dans les transports notamment) car ils impliquent des coûts supplémentaires. Toutes les ruptures de charge demandent de la coordination et augmentent les délais et le coût. Dans l'édition numérique ces ruptures de charges sont importantes. Produire les métadonnées, les formats différents, l'archivage ... meta données = données sur les données (sur un livre = titre, auteur, nb de pages...) le procédé habituel des éditeurs est le FDCTT (faire et défaire c'est toujours travailler) ici, procès du SSP = single source publishing. Graal encore peu atteint aujourd'hui. Système d'informations pensé par un architecte des systèmes d'info. Tout est lié, pas de rupture de charge; un format pivot sur lequel je peux faire les modifs successives et qui peut produire la modifs sur tous les supports dont j'ai besoin. Les formats pivots sont très souvent en XML, centré sur le fond, la structure, au lieu du PAO (utilisé habituellement), centré sur l'apparence

Temps 3 : édition nativement en ligne Ex : wikipedia caractéristiques = elle s'appuie sur le nb d’utilisateurs et de producteurs, elle est commentable Retro-lien = inventé par les blogs. les "ping" signalant qu'un blog en cite un autre Définition : qu'est-ce qu'un RÉTROLIEN ? Une définition d'un rétrolien également appelé backlink ou trackback ou lien inverse : http://dicoblog.canalblog.com/archives/2008/11/17/11399790.html "Je pourrais vous dire que le rétrolien est un système de liens semi-automatisé entre deux ou plusieurs blogs, permettant à l'auteur et au lecteur d'un message de savoir quel autre blog a créé un lien vers ledit message. Les rétroliens ne sont pas utilisés par les blogueurs, qui savent de toute façon quels sont les liens qui pointent vers leurs messages par leurs statistiques ou par l'intérmédiaire de sites tels que Technorati..."

l'historique d'une page Wikipedia conserve toutes les modifs et version précédentes

Caractéristiques du texte électronique (idées élèves) : - multiformat - relève de l'économie de l'attention - modifiable - bien non rival (reproductible quasiment sans coût spécifique mais coût énergétique et salaires des informaticiens) - commentable - collaboratif - interactif

récap prof : - dématérialisé (quasiment immatériel car réalité physique des objets numériques, des data center...) - circule avec une grande fluidité - peut se doter de couches successives - hypertextualité (les liens qui permettent d'aller d'une page à l'autre . conseil de mettre de l'hypertexte dans les textes produits) - indexable (fait par des tiers qui obéissent à des logiques différentes - relève de l'économie de l'attention et plus de la rareté

jeudi 14/01 Retour sur cette question des couches successives. Le multicouche = Une multitudes de couches d'informations qui sont vivantes (dès le MA, déjà 2 couches, celui qui copie et celui qui annote. Mais restreint) dans le numérique, multicouches : le texte meta données = - méta données biblio (auteur, titre...) - méta données annotations auto (text mining) - méta données lecteur (mots clés) - meta données annotations commentaires, retroliens - vitesse, fréquentation, Page Rank (note donnée de 0 à 10 par Google à toutes les pages du monde. elle s'appuie sur l'idée qu'un lien vers une page web est un vote positif sur cette page. Une note de 8 est obtenue rarement, Le monde par ex (def Wikipedia = Le principe de base est d'attribuer à chaque page une valeur (ou score) proportionnelle au nombre de fois que passerait par cette page un utilisateur parcourant le graphe du Web en cliquant aléatoirement, sur un des liens apparaissant sur chaque page. Ainsi, une page a un PageRank d'autant plus important qu'est grande la somme des PageRanks des pages qui pointent vers elle (elle comprise, s'il y a des liens internes). Le PageRank est une mesure de centralité sur le réseau du web.) On peut installer un plugin qui donne cette info sur la barre de navigation.

algorithme Panda de Google = contrer les fermes de contenus. ceux qui veulent juste gagner de l'argetn et comme publicité rémunérées au clic donc je vais aller pomper dans des sites connus genre wikipédia, doctissimo, marmiton... et donc, dans google je suis en concurrence avec ces sites. Ce sont des pirates de contenus. Contenus copiés illégalement pour attirer attention des internautes sur une page, de pub le plus souvent. Google peut sanctionner ce type de site avec un page rank de zéro.

algorihme Pinguin = contrer les fermes de liens. SIO = Search Ingine optimization. métier du référencement. On peut développer des sites avec plus ou moins de contenus et vendent des liens vers votre contenu. Pratique frauduleuse sanctionnée par google si détectée.

idem pour mobile friendly : Google peut détecter si votre site est adapté ou non pour un usage sur mobile

Le texte électronique idéal a 3 grandes qualités = - lisible. Pour être visible, le texte doit être dans un format ouvert (ex : wikipédia est en HTML, le format ouvert par excellence)

@@ Ligne 6 : / Ligne 6 : @@
 Grâce au numérique, la rareté n'est plus de mise, nous entrons dans une autre économie, celle de '''l'attention'''.
 C'est l'attention du public qui devient rare du fait de la profusion de documents disponibles sur Internet. (quand je donne le bien je ne m'en dépossède pas, '''biens non rivaux''') : Chance historique.
+===Différentes modèle économiques===
 '''Modèle du péage''' pour reproduire artificiellement de la rareté choisi par certaines presses. Ne fonctionne pas, réduit le lectorat.
@@ Ligne 15 : / Ligne 17 : @@
 Ex : Dropbox. Toutes les fonctionnalités dispo gratuitement avec 2 Gigas , mais donc espace limité. Pari qu'entre 5 et 8% pourraient passer potentiellement au modèle premium pour obtenir stockage supplémentaire.
 Skype au départ était freemium (dès que plus de 2 utilisateurs en visioconf, passer en payant)
 Interêt initial : faire que les lecteurs nous lisent; Ensuite, passer au freemium.
 Mais comment ? le cookie du New York Times qui comptabilise le nombre d'articles lus et bloque l'accès aux internautes au bout d'un certain nb de lecture gratuites en ligne. Mais très faiblement coercitif. Logique B2C (business for consumers). Il suffit qu'on change de session pour avoir un accès de nouveau.
@@ Ligne 25 : / Ligne 28 : @@
 '''4 plateformes''' : revues.org, calenda, hypothèses (carnet de recherches, blogs de chercheurs), OpenEdition Books
-'''Histoire de l'édition''' :
+=== Histoire de l'édition ===
 Wikipédia (années 2000) modèle le plus achevé d'édition éléctronique
 : projet Gutemberg. un étudiant à qui on prête un ordinateur et qui tape la déclaration d'indépendance des USA en ASCII . Ce projet existe toujours.
@@ Ligne 53 : / Ligne 57 : @@
 conserve toutes les modifs et version précédentes
-'''caractéristique du texte éléctronique'''  (idées élèves) :
+'''Caractéristiques du texte électronique'''  (idées élèves) :
 - multiformat
 - relève de l'économie de l'attention
@@ Ligne 86 : / Ligne 90 : @@
 idem pour mobile friendly : Google peut détecter si votre site est adapté ou non pour un usage sur mobile
+'''Le texte électronique idéal''' a 3 grandes qualités =
+- lisible. Pour être visible, le texte doit être dans un format ouvert (ex : wikipédia est en HTML, le format ouvert par excellence)

Cours Audrey Open Edition : Différence entre versions

Version du 14 janvier 2016 à 11:12

Différentes modèle économiques

Histoire de l'édition

Menu de navigation

Outils personnels

Espaces de noms

Variantes

Affichages

Plus

Rechercher

Navigation

Outils