Mon espace Wikipédia

Vous pouvez trouver mon profils Wikipédia sous le pseudo Arsene Miloard

Intro Module OpenEdition

Mail de l'intervenant : marin.dacos@openedition.org

La plateforme OpenEdition, l'idée derrière le terme est celle d'un tirage illimité (impossible en format papier).

L'économie de l'édition

L'éco de la rareté : Plus un bien est rare plus il vaut. Si une personne donne le bien, il le perd (Bien rivaux). Le numérique révolutionne ce système, si on donne on peut garder (modèle peer to peer, modèle de copie etc.)

Nouvelle économie, l'économie de l'attention : Il faut pour l'ouvrage attirer le lecteur car le nombre d'ouvrage est infinie.

Ce changement d'économie bouleverse ensemble des métier du livre.

Aujourd'hui on doit inventer de nouvelle économie, autour de l'open-acces (quelque rare exemple peuvent vivre sans : Médiapart) On voit apparaitre une hybridation de contenue : information ouvert et information abonnés. Malgré tout ces modèles montrent des faiblesses.

Les Modèles d'open accès

Le freemium différent du PayToWin, il permet d'avoir une expérience complète, avec des services supplémentaire payant. 5/8 % des utilisateurs payes les services supplémentaire.

Le New York Times adapte le freemium à l'édition, il limite à 10 le nombres d'articles pouvant être lu. Or d'un point de vu technique il peut être contourné très facilement (vider le cache cookie).

L'avantage est qu'il n'y à pas d'inscription pour limiter l'utilisateur.
C'est un modéle B2C

Quelques exemples :

Le Modéle d'OpenEdition

Les ouvrages sont des ouvrages de recherches scientifique.

Le modèle d'édition choisis est le modèle B2B (Buisnes to buisnes) qui s'adresse aux bibliothèque en vendant des services sur le contenue.

En HTML les ouvrages sont gratuit
Les pdf et les epub sont payant
Les stat des ouvrages et les formats MARC sont payant

La cible est le chercheur qui lui cherche à établir une bibliothèque en local, pour pouvoir l'annoter, pour pouvoir l'emporter hors ligne etc...

Historique et type d'ouvrages numérique

Le project Gutenberg
BusaRoberto Busa , fait l'Index Thomisticus en 1946

La numérisation

C'est le projet Galica, Gutenberg, google books ou encore l'Index Thomisticus.

On essaie à partir de là d'effectuer de la fouille de texte (chercher des informations et les ressortir du texte, c'est tut ce qui est web sémantique par exemple). Les technologie utilisé sont l'OCR (reconnaissance optique de caractère)

Les recherches effectuée avec Google Ngram utilise le Text Minning

Text Minning : En extrapolant il est possible d'extraire les informations et métadonnées du texte sous format XML. Et de créer un robot capable de faire ce travail par la suite, un robot apprenant. (par exemple BILBO de OpenEdition Lab ) L'avantage et de pouvoir maintenir et créer des liens automatiquement (et ce n'est qu'un exemple)

L'édition native numérique

Apparait alors le WYSIWYG (les logiciels de PAO), or du coup on ne maitrise pas le code qui est derrière, et donc n'avoir aucun contrôle sur le code source ou les métadonnés.

Avec le multi-support apparait la rupture de charge, c'est le cout supplémentaire du changement de support. La complexité de sortie qui existait déjà dans le papier (livres, catalogues, articles etc.) ce multiplie avec le numérique (full text, format dédier, référencement etc.) L'idée derrière ça c'est FDCTT (faire et défaire c'est toujours travailler).

A chaque modification il faut ré-modifier chaque support (travail chiant et long)

Le SSP

Le Single source publishing. Si tout est reliée aux métadonnées on peut modifier très simplement le titre d'un document par exemple. Ou mieux, multiplier les sorties différents d'un même document (multisupport, multiformat etc.) sans effort.

Ce système permet de créer un texte en XML qui va ensuite être transformé à l'aide du langage XSLT

L'édition nativement en ligne

Par exemple Wikipédia.

Cette édition est commentable
On peut citer, faire des liens (URL)
On peut faire des rétrolien (si un post est cité, alors un commentaire est générer dans le post original)

Il est aussi possible de publier collectivement, c'est le système des Wiki et donc de Wikipédia (c'est le principe d'intelligence collective).

La vie de l'ouvrage numérique

La base de l'ouvrage est constitué du texte, de l'information de base. Avec le numérique les ouvrages ont une vie, des ajouts des différents collaborateurs.

C'est ajout forme les métadonnées :

Méta biblio
Annotation des lecteurs :
- Mot clé
- Rétrolien
- Commentaires
Annotation auto (text minning)
Page Rank
L'hypertext

Le page Rank

C'est le référencement d'une page web, le page rank est une note attribué par google noté sur 10, l'évolution est algorithmique.

Le monde à un page rank de 8
OpenEdition de 6

Le page rank prend en compte la fréquentation, le nombre de visite, le nombre de lien pointant vers un site, détecte aussi les fermes de liens et donc les pratique SEO, détecte les sites responsive.

Le texte électronique idéal

Il possède 3 grande qualité qu'il faut tacher à suivre.

Un format ouvert

Le texte doit être lisible et donc ouvert, c'est le cas de Wikipédia.

Le HTML est le code lisible par excellence, le format wiki permet de traduire une page en html pour la lecture web, en pdf pour le print par exemple.

Le DRM : Verrou numérique, il sacrifie la lisibilité du document et altère la confiance entre le lecteur et l'éditeur.

Water Marking : C'est une marque qui indique à qui appartient le livre, ce système respecte la lisibilité d'un ouvrage.

Un format recomposable, manipulable

C'est le Responsive, la mise en page doit pouvoir s'adapter à la taille de l'écran. Le modèle epub ou HTML le permet par exemple.

Indexable et cherchable

Par exemple l'ensemble des pages du web publique l'est. Le fichier ROBOTS.TXT permet de donner des indications aux robots de recherches (par exemple ne pas indexer tel ou tel contenu, blacklist). Le fichier Sitemap permet d'indiquer quelle contenue est indexable.

Les DRM par exemple empêche la recherche pleintext à l'intérieur des fichier.

Copiable et Collable

Le PDF entrave le copier collé, certain site web ou les livres en streming.

Les licence libre, de type Créative Commons (l'auteur déclare de façon unilatéral qu'il libère certain de ses droits sur l'ouvrage) par exemple permet de faciliter cet usage, en libérant l'ouvrage de certain des droits d'auteurs.

Les différents types de licences CC

BY : citer l'auteur
BY NC : Partage et modification, mais sans usages commerciaux
BY NC ND : Partage dans les même condition, sans usages commerciaux
BY SA : Partage dans les même condition
0 : Passer l'œuvre dans le domaine publique

Anotable et inscriptible

De plus ces notations doivent être elle-même dans un format ouvert. (ce qui n'est généralement pas le cas). Les DRM ont par exemple permit à Amazon de détruire des ouvrages et annotation directement sur les tablettes des gens (paaas bien !).

Un format conservable

Le format doit pouvoir être transmissible.

Identifiable

Pour pouvoir citer un document, il doit posséder un identifiant unique. Sur le web, c'est le système d'URL

TLD (top level domain) : .fr / .com / .us contrôle tout les domaine qui sont à gauche
Domaine : yahoo / google /cnrs Posséde et peut créer les Sous-domaine
Sous domaine : sous partie du domaine, créé et contrôlé par le domaine.
Chemin dans le serveur : wiki/Uniform_Resource_Locator

L'url doit pouvoir être dicté pour être correcte (donc une url courte)

Correctement écrit

Le "langage ou le code d'un texte doit pouvoir être transcrit dans l'ensemble du monde (ASCII était local, l'UNICODE est mondial) L'UNICODE est régulièrement mis à jour affin de prendre en compte de nouveaux caractères.

Le format doit lui aussi être ouvert, affin d'être lut par tout le monde.

Le Dublin Core

Enfin de document doit posséder des métadonnées renseignant son contenu, c'est le rôle du Dublin Core par exemple. La Dublin Core correspond à des normes de référencement spécifique, les "shémes)

Dublin core pour Star Wars 7

DC.TITLE LANG ="fr"="Star Wars 7. Le réveil de la force"
DC.TITLE LANG ="en"="..."

Caractéristique du Dublin Core On peut adapter nos balises, les répéter (un titre fr, un titre en etc.)

Élément	Élément (anglais)	Commentaire
1. Titre	Title	document
2. Créateur	Creator	Nom de la personne, de l'organisation ou du service à l'origine de la rédaction du document
3. Sujet ou mots clés	Subject	Mots-clefs, phrases de résumé, ou codes de classement
4. Description	Description	Résumé, table des matières, ou texte libre. Raffinements : table des matières, résumé
Éditeur	Publisher	Nom de la personne, de l'organisation ou du service à l'origine de la publication du document
6. Contributeur	Contributor	Nom d'une personne, d'une organisation ou d'un service qui contribue ou a contribué à l'élaboration du document. Chaque contributeur fait l'objet d'un élément Contributor séparé
7. Date	Date	Date d'un évènement dans le cycle de vie du document
8. Type de ressource	Type	Genre du contenu
9. Format	Format	MIME, ou format physique du document
Identifiant de la ressource	Identifier	Identificateur non ambigu : il est recommandé d'utiliser un système de référencement précis, afin que l'identifiant soit unique au sein du site, par exemple les URI ou les numéros ISBN. Raffinement : Is Available At
11. Source	Source	Ressource dont dérive le document : le document peut découler en totalité ou en partie de la ressource en question. Il est recommandé d'utiliser une dénomination formelle des ressources, par exemple leur URI
12. Langue	Language
13. Relation	Relation	Lien avec d'autres ressources. De nombreux raffinements permettent d'établir des liens précis, par exemple de version, de chapitres, de standard, etc.
14. Couverture	Coverage	Couverture spatiale (point géographique, pays, régions, noms de lieux) ou temporelle
15. Droits	Rights	Droits de propriété intellectuelle, Copyright, droits de propriété divers

Un format interopérable

La capacité de deux machines aux systèmes d'exploitation différent de communiquer entre elles (le ping ou le rétrolien par exemple).

Le RSS, créé par Aaron Swartz est un système de communication interopérable robuste.

Le protocole OAI (Open arche Initiative) PMH est un protocole de communication entre un entrepôt et un moissonneur utilisant des requêtes (Verb) et des réponses sous formes de métadonnées.

La veille

Les agrégateurs :

Feedly
Netvibes

Des sources d'intérêt

Korben : http://korben.info/
TED : https://www.ted.com/
Framasoft : http://framasoft.net/
BNF : http://www.bnf.fr/fr/acc/x.accueil.html
CNRS : http://www.cnrs.fr/
Patreon : https://www.patreon.com/
Kiss Kiss Bank Bank : http://www.kisskissbankbank.com/
Google groups TiddlyWiki : https://groups.google.com/forum/#!forum/tiddlywiki

Twitter et Diigo sont deux site extrêmement pertinent à utiliser en veille.

Twitter

Gestion de crise avec les #
Veille
https://tweetdeck.twitter.com/

Les bonnes pratiques de Web

Ne jamais afficher de : cliquer "ici"

Le site opquast liste l'ensemble des bonnes pratiques web.

Open-Edition Emile

Sommaire