Cours Audrey Open Edition : Différence entre versions

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche
Ligne 1 : Ligne 1 :
'''Marin Dacos''' - directeur du centre pour l'édition électronique ouverte. Parcours à la croisée de trois discipline : informatique - sciences humaines - édition  
+
'''Marin Dacos''' - directeur du centre pour l'édition électronique ouverte. Architecte des systèmes d'information - chercheur au CNRS. Parcours à la croisée de plusieurs  disciplines : histoire - informatique - sciences humaines - édition  
  
Présentation d'un point de vue professionnel d'open edition. marque déposée (anciennement IBM) = idée tirage illimité (on fait autant de tirage que nécessaire grâce au numérique)
+
Présentation d'un point de vue professionnel d'Open Edition (marque déposée) (anciennement IBM) = idée tirage illimité (on fait autant de tirage que nécessaire grâce au numérique)
 
Il s'agit d'un ''nouveau paradigme''.  
 
Il s'agit d'un ''nouveau paradigme''.  
Paradigme historique de l'édition/presse : celui de '''la rareté'''. Le bien est rare, plusieurs personnes en concurrence pour l'avoir, en jouir, le posséder. Le bien que je perds est un bien rival (je le donne je le perds)  
+
Paradigme historique de l'édition/presse : celui de '''la rareté'''. Le bien est rare, plusieurs personnes en concurrence pour l'avoir, en jouir, le posséder. Le bien que je perds est un '''bien rival''' (je le donne je le perds)  
 
Grâce au numérique, la rareté n'est plus de mise, nous entrons dans une autre économie, celle de '''l'attention'''.  
 
Grâce au numérique, la rareté n'est plus de mise, nous entrons dans une autre économie, celle de '''l'attention'''.  
C'est l'attention du public qui devient rare du fait de la profusion de documents disponibles sur Internet. (quand je donne le bien je ne m'en dépossède pas, biens non rivaux) : Chance historique.  
+
C'est l'attention du public qui devient rare du fait de la profusion de documents disponibles sur Internet. (quand je donne le bien je ne m'en dépossède pas, '''biens non rivaux''') : Chance historique.  
  
 
'''Modèle du péage''' pour reproduire artificiellement de la rareté choisi par certaines presses. Ne fonctionne pas, réduit le lectorat.  
 
'''Modèle du péage''' pour reproduire artificiellement de la rareté choisi par certaines presses. Ne fonctionne pas, réduit le lectorat.  
 
Obligation d'inventer de nouveaux modèles économiques. Exception Médiapart (mais pour le moment seulement !), ils sortent des affaires, font du buzz et donc créent de la rareté et des abonnements.  
 
Obligation d'inventer de nouveaux modèles économiques. Exception Médiapart (mais pour le moment seulement !), ils sortent des affaires, font du buzz et donc créent de la rareté et des abonnements.  
 
'''Modèles économiques hybrides''' choisis par Libé, le Figaro... : accès abonnés pour une partie du contenu et une autre partie en accès ouvert. Mais revenu insuffisant pour faire vivre de tels grands groupes de presse.  
 
'''Modèles économiques hybrides''' choisis par Libé, le Figaro... : accès abonnés pour une partie du contenu et une autre partie en accès ouvert. Mais revenu insuffisant pour faire vivre de tels grands groupes de presse.  
'''Modèle freemium''' : je peux jouer et gagner sur un jeu en ligne par exemple  
+
'''Modèle freemium''' : je peux jouer et gagner sur un jeu en ligne par exemple. C'est une expérience complète mais non intense
Ex : Dropbox. Toutes les fonctionnalités dispo gratuitement avec 2 Gigas , mais donc espace limité. Pari qu'entre 5 et 8% pourraient passer potentiellement au modèle premium.  
+
Ex : Dropbox. Toutes les fonctionnalités dispo gratuitement avec 2 Gigas , mais donc espace limité. Pari qu'entre 5 et 8% pourraient passer potentiellement au modèle premium pour obtenir stockage supplémentaire.  
 
Skype au départ était freemium (dès que plus de 2 utilisateurs en visioconf, passer en payant)  
 
Skype au départ était freemium (dès que plus de 2 utilisateurs en visioconf, passer en payant)  
 
Interêt initial : faire que les lecteurs nous lisent; Ensuite, passer au freemium.  
 
Interêt initial : faire que les lecteurs nous lisent; Ensuite, passer au freemium.  
Mais comment ? le cookie du New York Times qui comptabilise le nombre d'articles lus et bloque l'accès aux internautes au bout d'un certain nb de lecture gratuites en ligne. Mais très faiblement coercitif. B2C (il suffit qu'on change de session pour avoir un accès de nouveau)
+
Mais comment ? le cookie du New York Times qui comptabilise le nombre d'articles lus et bloque l'accès aux internautes au bout d'un certain nb de lecture gratuites en ligne. Mais très faiblement coercitif. Logique B2C (business for consumers). Il suffit qu'on change de session pour avoir un accès de nouveau.
 
Le coût de transaction = le coût matériel, le temps que je passe à faire une transaction avec qqun.  
 
Le coût de transaction = le coût matériel, le temps que je passe à faire une transaction avec qqun.  
  
Dans le modèle présenté par Monsieur dacos, on s'adresse aux bibliothèque universitaires. B2B. Cible : usage non intensif.  
+
Ici le CNRS est dans une logique B2B en s'adressant aux bibliothèques universitaire. Ils considèrent que l'usage intensif est liés aux professionnels. On va donc créer des services pour ces professionnels. Ils ont donc décidé de ne pas vendre de contenus, mais de vendre des services.
On ne vend pas de contenu normalement. Ce qui sera payant c'est des fichiers pdf et EPUb (formats spécifiques).  
+
Les cibles sont donc les chercheurs qui aiment créer des bibliothèques. Dans le numérique, ils ont envie d'avoir le livre ou la revue dans leur disque dur. A la fois pour l'annoter, ensuite pour pouvoir l'emporter partout sans forcément avoir de connexion Internet. Le CNRS leur vend donc des fichier PDF ou EPUB. Pour les télécharger il faut donc être abonné.  D'autres services comme les statistiques sont également payants.
cible : le chercheur qui a une immense bibliothèque et veut avoir la même chose sur son disque dur.  
+
.  
  
 
'''4 plateformes''' : revues.org, calenda, hypothèses (carnet de recherches, blogs de chercheurs), OpenEdition Books  
 
'''4 plateformes''' : revues.org, calenda, hypothèses (carnet de recherches, blogs de chercheurs), OpenEdition Books  
Ligne 30 : Ligne 30 :
 
'''trois temps qui cohabitent dans l'édition numérique :'''  
 
'''trois temps qui cohabitent dans l'édition numérique :'''  
  
'''Temps 1''' = numérisation (ex : projet Gallica de la BNF ou Google Books)  
+
'''Temps 1''' = numérisation (ex : projet Gallica de la BNF ou Google Books = un gigantesque programme de numérisation du savoir humain)  
 
text mining ou fouille de texte = on essaie de sortir du texte des informations, possible qu'après avoir numérisé le texte.  
 
text mining ou fouille de texte = on essaie de sortir du texte des informations, possible qu'après avoir numérisé le texte.  
Google fouille des textes par exemple. L
+
Google fouille des textes par exemple. Le plus connu en fouille de texte c'est Google Ngram grâce à de la ROC (reconnaissance optique de caractère, en anglais OCR). Ensuite il propose de chercher la fréquence d'un terme. mais on ignore ce que contient le corpus.  
e plus connu en fouille de texte c'est Google Ngram grâce à de la ROC (reconnaissance optique de caractère, en anglais OCR). Ensuite il propose de chercher la fréquence d'un terme. mais on ignore ce que contient le corpus.  
 
 
OpenEdition Lab : création de l'outil Bilbo. On lui dit comment on comprend une référence et on lui fournit 3000 références de départ qui servent d'apprentissage.
 
OpenEdition Lab : création de l'outil Bilbo. On lui dit comment on comprend une référence et on lui fournit 3000 références de départ qui servent d'apprentissage.
 
400 000 docs. Revues comme Persee.fr et Jstor.org qui fournissent aussi des publications en lignes avec recherches
 
400 000 docs. Revues comme Persee.fr et Jstor.org qui fournissent aussi des publications en lignes avec recherches
Ligne 40 : Ligne 39 :
 
Milieu des années 1980. Elle utilise les éditions numériques dès le début. Passe par la PAO.  
 
Milieu des années 1980. Elle utilise les éditions numériques dès le début. Passe par la PAO.  
 
What you see is what you get (WYSIWYG) permet de voir le rendu graphique immédiatement ce qui n'était pas le cas auparavant (il fallait coder les termes en gras...) le code est indispensable si l'on ne veut pas se faire maîtriser par lui (données cachées sous word par exemple qui gonflent le volume du fichier) sorte de palimpseste, attention, on peut donc parfois revenir sur les versions effacées et retrouver le texte que nous avions choisi de gommer.  
 
What you see is what you get (WYSIWYG) permet de voir le rendu graphique immédiatement ce qui n'était pas le cas auparavant (il fallait coder les termes en gras...) le code est indispensable si l'on ne veut pas se faire maîtriser par lui (données cachées sous word par exemple qui gonflent le volume du fichier) sorte de palimpseste, attention, on peut donc parfois revenir sur les versions effacées et retrouver le texte que nous avions choisi de gommer.  
cf support Dominique ROUX : en devenant numérique, l'édition n'est plus mono support. Avec le multisupport, intervient '''le pbm des ruptures de charge''' dans le workflow (= circuit de traitement, de l'auteur au livre final. ) On essaie de réduire ces ruptures de charge (notamment dans les transports)  
+
cf support Dominique ROUX : en devenant numérique, l'édition n'est plus mono support. Avec le multisupport, intervient '''le pbm des ruptures de charge''' dans le workflow (= circuit de traitement, de l'auteur au livre final. ) On essaie de réduire ces ruptures de charge (comme dans les transports notamment) car ils impliquent des coûts supplémentaires. Toutes les ruptures de charge demandent de la coordination et augmentent les délais et le coût. Dans l'édition numérique ces ruptures de charges sont importantes. Produire les métadonnées, les formats différents, l'archivage ...
 
meta données = données sur les données (sur un livre = titre, auteur, nb de pages...) le procédé habituel des éditeurs est le FDCTT (faire et défaire c'est toujours travailler) ici, '''procès du SSP''' = single source publishing. Graal encore peu atteint aujourd'hui. Système d'informations pensé par un architecte des systèmes d'info. Tout est lié, pas de rupture de charge; un format pivot sur lequel je peux faire les modifs successives et qui peut produire la modifs sur tous les supports dont j'ai besoin.  
 
meta données = données sur les données (sur un livre = titre, auteur, nb de pages...) le procédé habituel des éditeurs est le FDCTT (faire et défaire c'est toujours travailler) ici, '''procès du SSP''' = single source publishing. Graal encore peu atteint aujourd'hui. Système d'informations pensé par un architecte des systèmes d'info. Tout est lié, pas de rupture de charge; un format pivot sur lequel je peux faire les modifs successives et qui peut produire la modifs sur tous les supports dont j'ai besoin.  
 
Les formats pivots sont très souvent en XML, centré sur le fond, la structure, au lieu du PAO (utilisé habituellement), centré sur l'apparence  
 
Les formats pivots sont très souvent en XML, centré sur le fond, la structure, au lieu du PAO (utilisé habituellement), centré sur l'apparence  

Version du 13 janvier 2016 à 22:33

Marin Dacos - directeur du centre pour l'édition électronique ouverte. Architecte des systèmes d'information - chercheur au CNRS. Parcours à la croisée de plusieurs disciplines : histoire - informatique - sciences humaines - édition

Présentation d'un point de vue professionnel d'Open Edition (marque déposée) (anciennement IBM) = idée tirage illimité (on fait autant de tirage que nécessaire grâce au numérique) Il s'agit d'un nouveau paradigme. Paradigme historique de l'édition/presse : celui de la rareté. Le bien est rare, plusieurs personnes en concurrence pour l'avoir, en jouir, le posséder. Le bien que je perds est un bien rival (je le donne je le perds) Grâce au numérique, la rareté n'est plus de mise, nous entrons dans une autre économie, celle de l'attention. C'est l'attention du public qui devient rare du fait de la profusion de documents disponibles sur Internet. (quand je donne le bien je ne m'en dépossède pas, biens non rivaux) : Chance historique.

Modèle du péage pour reproduire artificiellement de la rareté choisi par certaines presses. Ne fonctionne pas, réduit le lectorat. Obligation d'inventer de nouveaux modèles économiques. Exception Médiapart (mais pour le moment seulement !), ils sortent des affaires, font du buzz et donc créent de la rareté et des abonnements. Modèles économiques hybrides choisis par Libé, le Figaro... : accès abonnés pour une partie du contenu et une autre partie en accès ouvert. Mais revenu insuffisant pour faire vivre de tels grands groupes de presse. Modèle freemium : je peux jouer et gagner sur un jeu en ligne par exemple. C'est une expérience complète mais non intense Ex : Dropbox. Toutes les fonctionnalités dispo gratuitement avec 2 Gigas , mais donc espace limité. Pari qu'entre 5 et 8% pourraient passer potentiellement au modèle premium pour obtenir stockage supplémentaire. Skype au départ était freemium (dès que plus de 2 utilisateurs en visioconf, passer en payant) Interêt initial : faire que les lecteurs nous lisent; Ensuite, passer au freemium. Mais comment ? le cookie du New York Times qui comptabilise le nombre d'articles lus et bloque l'accès aux internautes au bout d'un certain nb de lecture gratuites en ligne. Mais très faiblement coercitif. Logique B2C (business for consumers). Il suffit qu'on change de session pour avoir un accès de nouveau. Le coût de transaction = le coût matériel, le temps que je passe à faire une transaction avec qqun.

Ici le CNRS est dans une logique B2B en s'adressant aux bibliothèques universitaire. Ils considèrent que l'usage intensif est liés aux professionnels. On va donc créer des services pour ces professionnels. Ils ont donc décidé de ne pas vendre de contenus, mais de vendre des services. Les cibles sont donc les chercheurs qui aiment créer des bibliothèques. Dans le numérique, ils ont envie d'avoir le livre ou la revue dans leur disque dur. A la fois pour l'annoter, ensuite pour pouvoir l'emporter partout sans forcément avoir de connexion Internet. Le CNRS leur vend donc des fichier PDF ou EPUB. Pour les télécharger il faut donc être abonné. D'autres services comme les statistiques sont également payants. .

4 plateformes : revues.org, calenda, hypothèses (carnet de recherches, blogs de chercheurs), OpenEdition Books

Histoire de l'édition : Wikipédia (années 2000) modèle le plus achevé d'édition éléctronique 1971 : projet Gutemberg. un étudiant à qui on prête un ordinateur et qui tape la déclaration d'indépendance des USA en ASCII . Ce projet existe toujours. 1949 : père Roberto Busa (ecclésiastique italien) qui s'associe avec IBM. Fait des études sur Saint Thomas d'Aquin et fait un Index Thomisticus (30 ans, 56 volumes édités)

trois temps qui cohabitent dans l'édition numérique :

Temps 1 = numérisation (ex : projet Gallica de la BNF ou Google Books = un gigantesque programme de numérisation du savoir humain) text mining ou fouille de texte = on essaie de sortir du texte des informations, possible qu'après avoir numérisé le texte. Google fouille des textes par exemple. Le plus connu en fouille de texte c'est Google Ngram grâce à de la ROC (reconnaissance optique de caractère, en anglais OCR). Ensuite il propose de chercher la fréquence d'un terme. mais on ignore ce que contient le corpus. OpenEdition Lab : création de l'outil Bilbo. On lui dit comment on comprend une référence et on lui fournit 3000 références de départ qui servent d'apprentissage. 400 000 docs. Revues comme Persee.fr et Jstor.org qui fournissent aussi des publications en lignes avec recherches

Temps 2 : édition nativement numérique. . Milieu des années 1980. Elle utilise les éditions numériques dès le début. Passe par la PAO. What you see is what you get (WYSIWYG) permet de voir le rendu graphique immédiatement ce qui n'était pas le cas auparavant (il fallait coder les termes en gras...) le code est indispensable si l'on ne veut pas se faire maîtriser par lui (données cachées sous word par exemple qui gonflent le volume du fichier) sorte de palimpseste, attention, on peut donc parfois revenir sur les versions effacées et retrouver le texte que nous avions choisi de gommer. cf support Dominique ROUX : en devenant numérique, l'édition n'est plus mono support. Avec le multisupport, intervient le pbm des ruptures de charge dans le workflow (= circuit de traitement, de l'auteur au livre final. ) On essaie de réduire ces ruptures de charge (comme dans les transports notamment) car ils impliquent des coûts supplémentaires. Toutes les ruptures de charge demandent de la coordination et augmentent les délais et le coût. Dans l'édition numérique ces ruptures de charges sont importantes. Produire les métadonnées, les formats différents, l'archivage ... meta données = données sur les données (sur un livre = titre, auteur, nb de pages...) le procédé habituel des éditeurs est le FDCTT (faire et défaire c'est toujours travailler) ici, procès du SSP = single source publishing. Graal encore peu atteint aujourd'hui. Système d'informations pensé par un architecte des systèmes d'info. Tout est lié, pas de rupture de charge; un format pivot sur lequel je peux faire les modifs successives et qui peut produire la modifs sur tous les supports dont j'ai besoin. Les formats pivots sont très souvent en XML, centré sur le fond, la structure, au lieu du PAO (utilisé habituellement), centré sur l'apparence

Temps 3 : édition nativement en ligne Ex : wikipedia caractéristiques = elle s'appuie sur le nb d’utilisateurs et de producteurs, elle est commentable Retro-lien = inventé par les blogs. les "ping" signalant qu'un blog en cite un autre Définition : qu'est-ce qu'un RÉTROLIEN ? Une définition d'un rétrolien également appelé backlink ou trackback ou lien inverse : http://dicoblog.canalblog.com/archives/2008/11/17/11399790.html "Je pourrais vous dire que le rétrolien est un système de liens semi-automatisé entre deux ou plusieurs blogs, permettant à l'auteur et au lecteur d'un message de savoir quel autre blog a créé un lien vers ledit message. Les rétroliens ne sont pas utilisés par les blogueurs, qui savent de toute façon quels sont les liens qui pointent vers leurs messages par leurs statistiques ou par l'intérmédiaire de sites tels que Technorati..."

l'historique d'une page Wikipedia conserve toutes les modifs et version précédentes

caractéristique du texte éléctronique : - multiformat - relève de l'économie de l'attention - modifiable - bien non rival (reproductible quasiment sans coût spécifique mais coût énergétique et salaires des informaticiens) - commentable - collaboratif - interactif - dématérialisé (quasiment immatériel car réalité physique des objets numériques, des data center...) - circule avec une grande fluidité - peut se doter de couches successives