Cours Open Édition Clélie
Cours par Marin Dacos, Open Édition.
- Mon wikipedia : CleliaWD
- Mon Diigo : à venir
- Ma veille en commun
Sommaire
Les modèles
Économie de la rareté : objet en unique exemplaire, ne peut être possédé que par 1 personne à chaque fois. L'objet est rare. (biens rivaux)
Économie de l'attention : objet disponible pour tous (numérique). "L'attention" est alors la chose rare, car la ressource, elle, est infinie. Il faut attirer l'attention. (bien non rival)
= changement de paradigme.
Pour la presse par exemple, besoin d'inventer de nouveaux modèles économiques.
Autres modèles :
- hybride : contenus payants et gratuits coexistants
- Freemium : tout accès gratuitement (Free), mais exp amélioré en payant (Premium). (≠ PayToWin) Moyenne de 5-8% des utilisateurs qui passent Premium.
Importance du moment de la transaction (ex : NewYorkTimes fait payer pour lire les articles à partir du 10e, et non du 1er - logique B2C).
Cible OpenÉdition : B2C (bibliothèques universitaires).
Modèle Freemium : lecture HTML 100% gratuite. Premium : possibilité de DL en PDF, EPub (création d'une bibliothèque perso) + accès aux statistiques statistiques + format MARC (biblio).
Contenu gratuit, services payants.
Site compatible à la fois pour les biblio et pour les particuliers (compatible Apple bookstore ou autre).
L'édition numérique
- Roberto Busa (1946) : Index Thomisticus - numérisation, données portées sur CD-rom
- Projet Gutemberg (1971) : livres tapés par des gens et mis à dispo de tous.
- Gallica : numérisation JPEG (BNF)
- GoogleBooks
Fouille de texte - text mining (/data mining - big data).
On extrait de nouvelles données à partir de données existantes (stats) - idem pour les textes.
Google Ngram : stats à partir du corpus de GoogleBooks (OCR Optical Caracter Recognition - reconnaissance optique de caractère : on reconnait les caractères image)
(attention, composition du corpus ?)
Outiller le corpus <=> grandes possibilités (ex : Bilbo Open Edition)
WYSIWYG (what you see is what you get) : encodage => PAO
L'édition nativement numérique
Dispositif sans rupture de charge ? (= points de transfert)
SPP : single source publishing.
On a une source (pivot), lorsqu'on la modifie, ça impacte tous les dérivés (formats PDF, e-pub, online...)
On peut décrire une mise en forme pour chaque format (sur mon format 1, les titres sont toujours comme ceci. Au format 2, ils sont comme cela.) (même principe que HTML/CSS : ici, texte XML => tranformé XSLT)
Grâce aux métadonnées, toute la chaîne est automatisée et on travaille seulement sur une source d'origine.
L'édition nativement en ligne
Exemple : Wikipedia
- commentable (site B cite le site A, le cite A reçoit un ping pour proposer de générer un commentaire sous son article avec un lien vers l'article du site B qui cite le sien (retrolien).)
- InfoBox
- Guerre d'édition ? (historique toujours accessible, transparence).
Caractéristiques du texte numérique idéal :
- Multiformat, multiplateforme
- dématérialisé
- modifiable
- collaboratif
- commentable
- économie de l'attention, bien non rival
- interactif
- indépendant de la position, distance
/!\ attention, penser à l'infrastructure nécessaire même pour du virtuel.
5 caractéristiques fondamentales
- Immatériel (ou presque : serveurs, machines)
- Reproductible quasiment sans coût (ou presque : coûts énergie)
- Circule avec une grande fluidité
- Couches successives (Le texte lui-même, métadonnées (outils metabiblio, annotations de lecture (mots clés, résumés), annotations numériques (commentaires, retroliens), annotations automatiques (textmining)), données de référencement/SEO (page rank, vitesse, fréquentation, duplicate content (Google Panda > Pinguin))
- Hypertextualité
Le texte numérique idéal est...
Lisible
- Format ouvert : HTML, XML, EPub, RTF, DOCx, JPEG, ... (/!\ DRM ou watermarking, pour empécher le format d'être "ouvert") - reverse engineering (ex : problème Apple)
- Recomposable (par ex. responsive) et accessible (conformément au W3C ; balises Alt des <img>)
- Conservable #CodeIsLaw
Manipulable
- Indexable et cherchable (robot.txt)
- Copiable et collable | Creative Commons : déclaration unilatérale de l'autorisation d'utiliser un contenu (différents types d'utilisation)
- Annotable et inscriptible
Citable
- Identifiable (URL (résolution DNS))
- Correctement décrit (encodage des caractères ASCII, unicode
- Interropérable | OAI PMH : Open Arche Initiative - Protocol For Metadata (l'information circule de l'entrepôt (cible) au moissonneur (questionneur) qui utilise des "verbes". Reconnait les métadonnées DublinCore.)
Veille et curation
Agrégateurs de flux: Feedly, Netvibes
Agrégateurs de favoris : Diigo, Yahoo Pipes
Agrégateur twitter : Tweet Deck
Mes sources à suivre :
- Journal du CM
- Blog du modérateur
- Presse Citron
- Journal du geek
- BeInWeb
- Hitek
- Siècle Digital
- OutilsVeille.com
- Il était une pub
- Culture Pub
Workflow : modélisation du cheminement de la donnée (peut être graphique (schéma visuel) ou non). Quelle source, quelle valeur ajoute par chaque acteur au cours de la chaîne ?
(SSP est un workflow)
Le système d'information d'une entreprise est l'ensemble des informations manipulées, leur structure et toutes les interactions (/!\ BDD).
Les Bots wikipedia annulent rapidement les modifications de "trolls" (exemple : ajouts d'insultes et autres "prout" sur les pages de politiciens, etc.)