Cours Open Édition Clélie

Cours par Marin Dacos, Open Édition.

Mon wikipedia : CleliaWD
Mon Diigo : à venir
Ma veille en commun

Sommaire

1 Les modèles
2 L'édition numérique
3 L'édition nativement numérique
4 L'édition nativement en ligne
5 5 caractéristiques fondamentales
6 Le texte numérique idéal est...
7 Veille et curation

Les modèles

Économie de la rareté : objet en unique exemplaire, ne peut être possédé que par 1 personne à chaque fois. L'objet est rare. (biens rivaux)
Économie de l'attention : objet disponible pour tous (numérique). "L'attention" est alors la chose rare, car la ressource, elle, est infinie. Il faut attirer l'attention. (bien non rival)
= changement de paradigme.

Pour la presse par exemple, besoin d'inventer de nouveaux modèles économiques.

Autres modèles :

hybride : contenus payants et gratuits coexistants
Freemium : tout accès gratuitement (Free), mais exp amélioré en payant (Premium). (≠ PayToWin) Moyenne de 5-8% des utilisateurs qui passent Premium.

Importance du moment de la transaction (ex : NewYorkTimes fait payer pour lire les articles à partir du 10e, et non du 1er - logique B2C).

Cible OpenÉdition : B2C (bibliothèques universitaires).
Modèle Freemium : lecture HTML 100% gratuite. Premium : possibilité de DL en PDF, EPub (création d'une bibliothèque perso) + accès aux statistiques statistiques + format MARC (biblio).
Contenu gratuit, services payants.
Site compatible à la fois pour les biblio et pour les particuliers (compatible Apple bookstore ou autre).

L'édition numérique

Roberto Busa (1946) : Index Thomisticus - numérisation, données portées sur CD-rom
Projet Gutemberg (1971) : livres tapés par des gens et mis à dispo de tous.
Gallica : numérisation JPEG (BNF)
GoogleBooks

Fouille de texte - text mining (/data mining - big data).
On extrait de nouvelles données à partir de données existantes (stats) - idem pour les textes.

Google Ngram : stats à partir du corpus de GoogleBooks (OCR Optical Caracter Recognition - reconnaissance optique de caractère : on reconnait les caractères image)
(attention, composition du corpus ?)
Outiller le corpus <=> grandes possibilités (ex : Bilbo Open Edition)

WYSIWYG (what you see is what you get) : encodage => PAO

L'édition nativement numérique

Dispositif sans rupture de charge ? (= points de transfert)

SPP : single source publishing.
On a une source (pivot), lorsqu'on la modifie, ça impacte tous les dérivés (formats PDF, e-pub, online...)
On peut décrire une mise en forme pour chaque format (sur mon format 1, les titres sont toujours comme ceci. Au format 2, ils sont comme cela.) (même principe que HTML/CSS : ici, texte XML => tranformé XSLT)
Grâce aux métadonnées, toute la chaîne est automatisée et on travaille seulement sur une source d'origine.

L'édition nativement en ligne

Exemple : Wikipedia

commentable (site B cite le site A, le cite A reçoit un ping pour proposer de générer un commentaire sous son article avec un lien vers l'article du site B qui cite le sien (retrolien).)
InfoBox
Guerre d'édition ? (historique toujours accessible, transparence).

Caractéristiques du texte numérique idéal :

Multiformat, multiplateforme
dématérialisé
modifiable
collaboratif
commentable
économie de l'attention, bien non rival
interactif
indépendant de la position, distance

/!\ attention, penser à l'infrastructure nécessaire même pour du virtuel.

5 caractéristiques fondamentales

Immatériel (ou presque : serveurs, machines)
Reproductible quasiment sans coût (ou presque : coûts énergie)
Circule avec une grande fluidité
Couches successives (Le texte lui-même, métadonnées (outils metabiblio, annotations de lecture (mots clés, résumés), annotations numériques (commentaires, retroliens), annotations automatiques (textmining)), données de référencement/SEO (page rank, vitesse, fréquentation, duplicate content (Google Panda > Pinguin))
Hypertextualité

Le texte numérique idéal est...

Lisible

Format ouvert : HTML, XML, EPub, RTF, DOCx, JPEG, ... (/!\ DRM ou watermarking, pour empécher le format d'être "ouvert") - reverse engineering (ex : problème Apple)
Recomposable (par ex. responsive) et accessible (conformément au W3C ; balises Alt des <img>)
Conservable #CodeIsLaw

Manipulable

Indexable et cherchable (robot.txt)
Copiable et collable | Creative Commons : déclaration unilatérale de l'autorisation d'utiliser un contenu (différents types d'utilisation)
Annotable et inscriptible

Citable

Identifiable (URL (résolution DNS))
Correctement décrit (encodage des caractères ASCII, unicode
Interropérable | OAI PMH : Open Arche Initiative - Protocol For Metadata (l'information circule de l'entrepôt (cible) au moissonneur (questionneur) qui utilise des "verbes". Reconnait les métadonnées DublinCore.)

Veille et curation

Agrégateurs de flux: Feedly, Netvibes
Agrégateurs de favoris : Diigo, Yahoo Pipes
Agrégateur twitter : Tweet Deck

Mes sources à suivre :

Workflow : modélisation du cheminement de la donnée (peut être graphique (schéma visuel) ou non). Quelle source, quelle valeur ajoute par chaque acteur au cours de la chaîne ?
(SSP est un workflow)

Le système d'information d'une entreprise est l'ensemble des informations manipulées, leur structure et toutes les interactions (/!\ BDD).

Les Bots wikipedia annulent rapidement les modifications de "trolls" (exemple : ajouts d'insultes et autres "prout" sur les pages de politiciens, etc.)

Cours Open Édition Clélie

Sommaire

Les modèles

L'édition numérique

L'édition nativement numérique

L'édition nativement en ligne

5 caractéristiques fondamentales

Le texte numérique idéal est...

Lisible

Manipulable

Citable

Veille et curation

Menu de navigation

Outils personnels

Espaces de noms

Variantes

Affichages

Plus

Rechercher

Navigation

Outils