Cours Open Édition Clélie

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche

Cours par Marin Dacos, Open Édition.


Les modèles

Économie de la rareté : objet en unique exemplaire, ne peut être possédé que par 1 personne à chaque fois. L'objet est rare. (biens rivaux)
Économie de l'attention : objet disponible pour tous (numérique). "L'attention" est alors la chose rare, car la ressource, elle, est infinie. Il faut attirer l'attention. (bien non rival)
= changement de paradigme.

Pour la presse par exemple, besoin d'inventer de nouveaux modèles économiques.

Autres modèles :

  • hybride : contenus payants et gratuits coexistants
  • Freemium : tout accès gratuitement (Free), mais exp amélioré en payant (Premium). (≠ PayToWin) Moyenne de 5-8% des utilisateurs qui passent Premium.


Importance du moment de la transaction (ex : NewYorkTimes fait payer pour lire les articles à partir du 10e, et non du 1er - logique B2C).

Cible OpenÉdition : B2C (bibliothèques universitaires).
Modèle Freemium : lecture HTML 100% gratuite. Premium : possibilité de DL en PDF, EPub (création d'une bibliothèque perso) + accès aux statistiques statistiques + format MARC (biblio).
Contenu gratuit, services payants.
Site compatible à la fois pour les biblio et pour les particuliers (compatible Apple bookstore ou autre).

L'édition numérique

  • Roberto Busa (1946) : Index Thomisticus - numérisation, données portées sur CD-rom
  • Projet Gutemberg (1971) : livres tapés par des gens et mis à dispo de tous.
  • Gallica : numérisation JPEG (BNF)
  • GoogleBooks


Fouille de texte - text mining (/data mining - big data).
On extrait de nouvelles données à partir de données existantes (stats) - idem pour les textes.

Google Ngram : stats à partir du corpus de GoogleBooks (OCR Optical Caracter Recognition - reconnaissance optique de caractère : on reconnait les caractères image)
(attention, composition du corpus ?)
Outiller le corpus <=> grandes possibilités (ex : Bilbo Open Edition)

WYSIWYG (what you see is what you get) : encodage => PAO

L'édition nativement numérique

Dispositif sans rupture de charge ? (= points de transfert)

SPP : single source publishing.
On a une source (pivot), lorsqu'on la modifie, ça impacte tous les dérivés (formats PDF, e-pub, online...)
On peut décrire une mise en forme pour chaque format (sur mon format 1, les titres sont toujours comme ceci. Au format 2, ils sont comme cela.) (même principe que HTML/CSS : ici, texte XML => tranformé XSLT)
Grâce aux métadonnées, toute la chaîne est automatisée et on travaille seulement sur une source d'origine.

L'édition nativement en ligne

Exemple : Wikipedia

  • commentable (site B cite le site A, le cite A reçoit un ping pour proposer de générer un commentaire sous son article avec un lien vers l'article du site B qui cite le sien (retrolien).)
  • InfoBox
  • Guerre d'édition ? (historique toujours accessible, transparence).


Caractéristiques du texte numérique idéal :

  • Multiformat, multiplateforme
  • dématérialisé
  • modifiable
  • collaboratif
  • commentable
  • économie de l'attention, bien non rival
  • interactif
  • indépendant de la position, distance

/!\ attention, penser à l'infrastructure nécessaire même pour du virtuel.

5 caractéristiques fondamentales

  • Immatériel (ou presque : serveurs, machines)
  • Reproductible quasiment sans coût (ou presque : coûts énergie)
  • Circule avec une grande fluidité
  • Couches successives (Le texte lui-même, métadonnées (outils metabiblio, annotations de lecture (mots clés, résumés), annotations numériques (commentaires, retroliens), annotations automatiques (textmining)), données de référencement/SEO (page rank, vitesse, fréquentation, duplicate content (Google Panda > Pinguin))
  • Hypertextualité

Le texte numérique idéal est...

Lisible

  • Format ouvert : HTML, XML, EPub, RTF, DOCx, JPEG, ... (/!\ DRM ou watermarking, pour empécher le format d'être "ouvert") - reverse engineering (ex : problème Apple)
  • Recomposable (par ex. responsive) et accessible (conformément au W3C ; balises Alt des <img>)
  • Conservable #CodeIsLaw

Manipulable

  • Indexable et cherchable (robot.txt)
  • Copiable et collable | Creative Commons : déclaration unilatérale de l'autorisation d'utiliser un contenu (différents types d'utilisation)
  • Annotable et inscriptible

Citable

  • Identifiable (URL (résolution DNS))
  • Correctement décrit (encodage des caractères ASCII, unicode
  • Interropérable | OAI PMH : Open Arche Initiative - Protocol For Metadata (l'information circule de l'entrepôt (cible) au moissonneur (questionneur) qui utilise des "verbes". Reconnait les métadonnées DublinCore.)

Veille et curation

Agrégateurs de flux: Feedly, Netvibes
Agrégateurs de favoris : Diigo, Yahoo Pipes
Agrégateur twitter : Tweet Deck

Mes sources à suivre :

Workflow : modélisation du cheminement de la donnée (peut être graphique (schéma visuel) ou non). Quelle source, quelle valeur ajoute par chaque acteur au cours de la chaîne ?
(SSP est un workflow)

Le système d'information d'une entreprise est l'ensemble des informations manipulées, leur structure et toutes les interactions (/!\ BDD).

Les Bots wikipedia annulent rapidement les modifications de "trolls" (exemple : ajouts d'insultes et autres "prout" sur les pages de politiciens, etc.)