Open-Edition Emile
Sommaire
Mon espace Wikipédia
Vous pouvez trouver mon profils Wikipédia sous le pseudo Arsene Miloard
Intro Module OpenEdition
Mail de l'intervenant : marin.dacos@openedition.org
La plateforme OpenEdition, l'idée derrière le terme est celle d'un tirage illimité (impossible en format papier).
L'économie de l'édition
L'éco de la rareté : Plus un bien est rare plus il vaut. Si une personne donne le bien, il le perd (Bien rivaux). Le numérique révolutionne ce système, si on donne on peut garder (modèle peer to peer, modèle de copie etc.)
Nouvelle économie, l'économie de l'attention : Il faut pour l'ouvrage attirer le lecteur car le nombre d'ouvrage est infinie.
Ce changement d'économie bouleverse ensemble des métier du livre.
Aujourd'hui on doit inventer de nouvelle économie, autour de l'open-acces (quelque rare exemple peuvent vivre sans : Médiapart) On voit apparaitre une hybridation de contenue : information ouvert et information abonnés. Malgré tout ces modèles montrent des faiblesses.
Les Modèles d'open accès
Le freemium différent du PayToWin, il permet d'avoir une expérience complète, avec des services supplémentaire payant. 5/8 % des utilisateurs payes les services supplémentaire.
Le New York Times adapte le freemium à l'édition, il limite à 10 le nombres d'articles pouvant être lu. Or d'un point de vu technique il peut être contourné très facilement (vider le cache cookie).
- L'avantage est qu'il n'y à pas d'inscription pour limiter l'utilisateur.
- C'est un modéle B2C
Quelques exemples :
Le Modéle d'OpenEdition
Les ouvrages sont des ouvrages de recherches scientifique.
Le modèle d'édition choisis est le modèle B2B (Buisnes to buisnes) qui s'adresse aux bibliothèque en vendant des services sur le contenue.
- En HTML les ouvrages sont gratuit
- Les pdf et les epub sont payant
- Les stat des ouvrages et les formats MARC sont payant
La cible est le chercheur qui lui cherche à établir une bibliothèque en local, pour pouvoir l'annoter, pour pouvoir l'emporter hors ligne etc...
Historique et type d'ouvrages numérique
- Le project Gutenberg
- BusaRoberto Busa , fait l'Index Thomisticus en 1946
La numérisation
C'est le projet Galica, Gutenberg, google books ou encore l'Index Thomisticus.
On essaie à partir de là d'effectuer de la fouille de texte (chercher des informations et les ressortir du texte, c'est tut ce qui est web sémantique par exemple). Les technologie utilisé sont l'OCR (reconnaissance optique de caractère)
- Les recherches effectuée avec Google Ngram utilise le Text Minning
Text Minning : En extrapolant il est possible d'extraire les informations et métadonnées du texte sous format XML. Et de créer un robot capable de faire ce travail par la suite, un robot apprenant. (par exemple BILBO de OpenEdition Lab ) L'avantage et de pouvoir maintenir et créer des liens automatiquement (et ce n'est qu'un exemple)
L'édition native numérique
Apparait alors le WYSIWYG (les logiciels de PAO), or du coup on ne maitrise pas le code qui est derrière, et donc n'avoir aucun contrôle sur le code source ou les métadonnés.
Avec le multi-support apparait la rupture de charge, c'est le cout supplémentaire du changement de support. La complexité de sortie qui existait déjà dans le papier (livres, catalogues, articles etc.) ce multiplie avec le numérique (full text, format dédier, référencement etc.) L'idée derrière ça c'est FDCTT (faire et défaire c'est toujours travailler).
A chaque modification il faut ré-modifier chaque support (travail chiant et long)
Le SSP
Le Single source publishing. Si tout est reliée aux métadonnées on peut modifier très simplement le titre d'un document par exemple. Ou mieux, multiplier les sorties différents d'un même document (multisupport, multiformat etc.) sans effort.
Ce système permet de créer un texte en XML qui va ensuite être transformé à l'aide du langage XSLT
L'édition nativement en ligne
Par exemple Wikipédia.
- Cette édition est commentable
- On peut citer, faire des liens (URL)
- On peut faire des rétrolien (si un post est cité, alors un commentaire est générer dans le post original)
Il est aussi possible de publier collectivement, c'est le système des Wiki et donc de Wikipédia (c'est le principe d'intelligence collective).
La vie de l'ouvrage numérique
La base de l'ouvrage est constitué du texte, de l'information de base. Avec le numérique les ouvrages ont une vie, des ajouts des différents collaborateurs.
C'est ajout forme les métadonnées :
- Méta biblio
- Annotation des lecteurs :
- Mot clé
- Rétrolien
- Commentaires
- Annotation auto (text minning)
- Page Rank
- L'hypertext
Le page Rank
C'est le référencement d'une page web, le page rank est une note attribué par google noté sur 10, l'évolution est algorithmique.
- Le monde à un page rank de 8
- OpenEdition de 6
Le page rank prend en compte la fréquentation, le nombre de visite, le nombre de lien pointant vers un site, détecte aussi les fermes de liens et donc les pratique SEO, détecte les sites responsive.
Le texte électronique idéal
Il possède 3 grande qualité qu'il faut tacher à suivre.
Un format ouvert
Le texte doit être lisible et donc ouvert, c'est le cas de Wikipédia.
Le HTML est le code lisible par excellence, le format wiki permet de traduire une page en html pour la lecture web, en pdf pour le print par exemple.
Le DRM : Verrou numérique, il sacrifie la lisibilité du document et altère la confiance entre le lecteur et l'éditeur.
Water Marking : C'est une marque qui indique à qui appartient le livre, ce système respecte la lisibilité d'un ouvrage.
Un format recomposable, manipulable
C'est le Responsive, la mise en page doit pouvoir s'adapter à la taille de l'écran. Le modèle epub ou HTML le permet par exemple.
Indexable et cherchable
Par exemple l'ensemble des pages du web publique l'est. Le fichier ROBOTS.TXT permet de donner des indications aux robots de recherches (par exemple ne pas indexer tel ou tel contenu, blacklist). Le fichier Sitemap permet d'indiquer quelle contenue est indexable.
Les DRM par exemple empêche la recherche pleintext à l'intérieur des fichier.
Copiable et Collable
Le PDF entrave le copier collé, certain site web ou les livres en streming.
Les licence libre, de type Créative Commons (l'auteur déclare de façon unilatéral qu'il libère certain de ses droits sur l'ouvrage) par exemple permet de faciliter cet usage, en libérant l'ouvrage de certain des droits d'auteurs.
Les différents types de licences CC
- BY : citer l'auteur
- BY NC : Partage et modification, mais sans usages commerciaux
- BY NC ND : Partage dans les même condition, sans usages commerciaux
- BY SA : Partage dans les même condition
- 0 : Passer l'œuvre dans le domaine publique
Anotable et inscriptible
De plus ces notations doivent être elle-même dans un format ouvert. (ce qui n'est généralement pas le cas). Les DRM ont par exemple permit à Amazon de détruire des ouvrages et annotation directement sur les tablettes des gens (paaas bien !).
Un format conservable
Le format doit pouvoir être transmissible.
Identifiable
Pour pouvoir citer un document, il doit posséder un identifiant unique. Sur le web, c'est le système d'URL
- TLD (top level domain) : .fr / .com / .us contrôle tout les domaine qui sont à gauche
- Domaine : yahoo / google /cnrs Posséde et peut créer les Sous-domaine
- Sous domaine : sous partie du domaine, créé et contrôlé par le domaine.
- Chemin dans le serveur : wiki/Uniform_Resource_Locator
L'url doit pouvoir être dicté pour être correcte (donc une url courte)
Correctement écrit
Le "langage ou le code d'un texte doit pouvoir être transcrit dans l'ensemble du monde (ASCII était local, l'UNICODE est mondial) L'UNICODE est régulièrement mis à jour affin de prendre en compte de nouveaux caractères.
Le format doit lui aussi être ouvert, affin d'être lut par tout le monde.
Le Dublin Core
Enfin de document doit posséder des métadonnées renseignant son contenu, c'est le rôle du Dublin Core par exemple. La Dublin Core correspond à des normes de référencement spécifique, les "shémes)
Dublin core pour Star Wars 7
- DC.TITLE LANG ="fr"="Star Wars 7. Le réveil de la force"
- DC.TITLE LANG ="en"="..."
Caractéristique du Dublin Core On peut adapter nos balises, les répéter (un titre fr, un titre en etc.)
| Élément | Élément (anglais) | Commentaire |
|---|---|---|
| 1. Titre | Title | document |
| 2. Créateur | Creator | Nom de la personne, de l'organisation ou du service à l'origine de la rédaction du document |
| 3. Sujet ou mots clés | Subject | Mots-clefs, phrases de résumé, ou codes de classement |
| 4. Description | Description | Résumé, table des matières, ou texte libre. Raffinements : table des matières, résumé |
| Éditeur | Publisher | Nom de la personne, de l'organisation ou du service à l'origine de la publication du document |
| 6. Contributeur | Contributor | Nom d'une personne, d'une organisation ou d'un service qui contribue ou a contribué à l'élaboration du document. Chaque contributeur fait l'objet d'un élément Contributor séparé |
| 7. Date | Date | Date d'un évènement dans le cycle de vie du document |
| 8. Type de ressource | Type | Genre du contenu |
| 9. Format | Format | MIME, ou format physique du document |
| Identifiant de la ressource | Identifier | Identificateur non ambigu : il est recommandé d'utiliser un système de référencement précis, afin que l'identifiant soit unique au sein du site, par exemple les URI ou les numéros ISBN. Raffinement : Is Available At |
| 11. Source | Source | Ressource dont dérive le document : le document peut découler en totalité ou en partie de la ressource en question. Il est recommandé d'utiliser une dénomination formelle des ressources, par exemple leur URI |
| 12. Langue | Language | |
| 13. Relation | Relation | Lien avec d'autres ressources. De nombreux raffinements permettent d'établir des liens précis, par exemple de version, de chapitres, de standard, etc. |
| 14. Couverture | Coverage | Couverture spatiale (point géographique, pays, régions, noms de lieux) ou temporelle |
| 15. Droits | Rights | Droits de propriété intellectuelle, Copyright, droits de propriété divers |
Un format interopérable
La capacité de deux machines aux systèmes d'exploitation différent de communiquer entre elles (le ping ou le rétrolien par exemple).
Le RSS, créé par Aaron Swartz est un système de communication interopérable robuste.
Le protocole OAI (Open arche Initiative) PMH est un protocole de communication entre un entrepôt et un moissonneur utilisant des requêtes (Verb) et des réponses sous formes de métadonnées.
La veille
Les agrégateurs :
- Feedly
- Netvibes
Des sources d'intérêt
- Korben : http://korben.info/
- TED : https://www.ted.com/
- Framasoft : http://framasoft.net/
- BNF : http://www.bnf.fr/fr/acc/x.accueil.html
- CNRS : http://www.cnrs.fr/
- Patreon : https://www.patreon.com/
- Kiss Kiss Bank Bank : http://www.kisskissbankbank.com/
- Google groups TiddlyWiki : https://groups.google.com/forum/#!forum/tiddlywiki
Twitter et Diigo sont deux site extrêmement pertinent à utiliser en veille.
- Gestion de crise avec les #
- Veille
- https://tweetdeck.twitter.com/
Les bonnes pratiques de Web
Ne jamais afficher de : cliquer "ici"
Le site opquast liste l'ensemble des bonnes pratiques web.