Projet Pro Lucie

De Learning Lab Environnements Connectés
Révision datée du 14 janvier 2016 à 13:13 par LucieMichel (discussion | contributions) (Le texte électronique idéal :)
Sauter à la navigation Sauter à la recherche

Idée du projet

Mon projet professionnel va s'orienter vers la communication de festival et plus précisément sur celle du festival Les Sucs en Scène. C'est un événement musical qui proposera sa troisième édition en 2016.

Contexte du festival

Ce festival est organisé par l'association Des Pieds Des Mains. C'est une groupe d'amis habitant en Haute-Loire pour la plupart, qui est à l'origine de cet événement.
Etant également altiligérienne, je connais certains de ses membres et j'ai aussi pu assister aux deux premières éditions.


Suivi de projet- Marin DACOS- notes du cours

Initiation à l'édition électronique
économie de la rareté ; économie de l'attention
Différents modèles développés par OpenEdition : modèle freemium (le plus connu : dropbox), skype était un modèle freemium (ex du New-York Times-B2C)
Coûts de transaction dans le numérique
Création de services aux professionnels pour usages intensifs, gratuit (exemple Bibliothèques universitaires - B2B). Fichiers PDF et EPUB
Bien non rival : quand on les donne on ne s'en dépossède pas (ex: la connaissances); Bien rival : quand on le donne on s'en dépossède (un stylo)

Histoire de l'édition électronique : Wikipedia : modèle le plus achevé de l'édition électronique 1971 : projet Gutenberg : partage à travers des caractères majuscules (encodés ASCII avec 255 caractères disponibles), de la déclaration d'indépendance des Etats-unis. 1949 : Père Roberto BUSA (ecclésiastique italien) étudie les écrits sacrés et réalise un index : Index Thomisticus avec l'aide d'IBM, 56 volumes édités, les données existent toujours Histoire de l'édition électronique se décompose en 3 temps :
1) La numérisation : GALLICA ; Google Books ; data mining (fouille de données) : explorer des données pour extraire une info supplémentaire ; Text mining (fouille de texte) : pour décréter la langue d'un texte et sortir du texte de livres (texte qui doit être numérisé au départ). Le plus connu : Google Ngram : fonctionnement : ROC (reconnaissance optique de caractères) Sites de numérisation : Persee.fr et Jstor.org
2) Edition nativement numérique : On entre dans une édition multisupports. Utilise des fichiers numériques dès le début (PAO), date du milieu des années 80 (1984 avec apparition Mac), "What You See Is What You Get", encodage sémantique. WYSIWYG : on voit graphiquement ce qu'on va obtenir. Gros défaut : on ne maîtrise pas le code qu'il y a derrière (il y a des données cachées). Dominique Roux : Multi-supports pose problème car on a une rupture de charge dans le Workflow du livre (circuit de traitement), des différentes formes qui interviennent dans le support. Rupture de charge : logistique = transport ; on doit transporter la charge sur un autre véhicule (entraîne des coûts supérieurs) Metadonnées : données sur les données, ex sur un livre : auteur, poids, prix, etc. Dublin Core FDCTT (faire et défaire c'est toujours travailler) SSP (single source publishing) : système d'information qui est pensé par un architecte des systèmes d'informations (pas de système de charge), s'appuie sur une seule source, on entre dans un modèle avec un format pivot (XML). Une seule source qui est la matrice de tous les autres formats. En SSP on essaye d'éviter toute rupture de charge. Format PAO : centré sur l'apparence, la forme finale
3) L'édition nativement en réseau/en ligne : c'est le troisième âge de l'édition électronique (ex :Wikipedia). S'appuie sur le nombre d'utilisateurs et de producteurs, elle est commentable. Rétrolien : lie deux articles grâce au Ping (équivalent du Poke sur Facebook), lorsqu'un article est cité dans un autre, on retrouve le Ping qui permet de retrouver les deux articles (l'un via l'autre). Infobox : synthèse structurée sur une page Wikipedia. Guerre d'édition

===L'édition numérique, c'est (propriétés intrinsèques) :===

- mobile
- multiformat/ multisupport
- économie de l'attention
- modifiable
- commentable
- bien non rival
- collaboratif
- "ouvert à tous" différent du deep web (face invisible d'internet)
- interactif
- proche = indépendant de la distance

Caractéristiques du texte numérique :
1-dématérialisé (quasiment immatériel) - DATA CENTER : salles qui contient des centaines de milliers de serveurs -
2-reproductible
3-circule avec une grande fluidité, peut se doter de couches successibles

mail : marin.dacos@openedition.org (envoyer compte wikipédia (nom de l'utilisateur) qu'on aura créé, et modifs qu'on a réalisées : fautes corrigées, ajout d'informations, etc. sur au moins 4 caractères)


(suite) Jeudi 14 janvier

4-Multicouches : Toutes les autres couches informationnelles en dehors du texte sont des métadonnées : métadonnées bibliographiques; annotations du lecteur (mots clé, résumé, --> DIIGO); annotations par commentaires publics, rétrolien; annotations automatiques (textmining); page rank : mesure la notoriété entre 0 et 10, en fonction des liens recherchés vers les pages.
Principes du Page Rank : mesure aussi le nombre de clics, principe rétro-lien, vitesse, nombre de clics et donc fréquentation des sites web.
Algorithme PANDA de Google : repère les fermes de contenus (pirates de contenus); détectent les "Duplicate contents" et les sanctionne (en lui donnant un Page Rank de 0, apparaît donc tout au fond des pages de résultats)
PINGOUIN : même principe que PANDA mais pour les liens (SEO : Search Enging Optimisation) : sites de ferme de liens sont condamnés par google Donc l'ensemble des contenus vers d'autres sites peut avoir un impact sur notre page.
Mobile friendly (facile à consulter sur un téléphone ou une tablette) Le texte est seulement un petit morceau des couches informationnelles qui qualifient le texte (sa confiance, sa notoriété, sa visibilité, etc.)

5- Hypertextualité du texte
6- Le texte numérique est index-able : indexation du livre ou des contenus par des tiers, qui produit des commentaires par-dessus
7- Le texte numérique relève de l'économie de l'attention et pas de l'économie de la rareté

Le texte électronique idéal :

3 grandes qualités :

I) Le livre/texte/billet de blog/notice, doit être lisible :

a) Le texte doit être dans un format ouvert : format dont les spécifications techniques sont connues, permettant à tout le monde d'utiliser ce format (le consulter) : exemple : HTML : format ouvert par excellence ; Le code Wiki est interprété et donne du HTML ; Autres formats ouverts : XML, EPUB, DOCX, RTF, JPG, TXT, . DRM (Digital Rights Management) : cryptent le fichier (le rendent illisible), système de verrou numérique qui crypte le livre et ne le décrypte qu'à une condition : que le système avec lequel on le lit ait acquis la condition, les droits pour la lecture. Le système contacte donc le vendeur pour savoir si l'acheteur a bien acquis les contenus, droits, pour le lire, si non, son achat sera illisible. NUMILOG : système de DRM qui prévoit de supprimer le livre dans un temps donné (au bout d'une semaine par exemple).
Avec les DRM changement de paradigme au niveau des éditions, choisir le livres sans DRM
Autre solution de protection compatible avec la lisibilité : le WaterMarking : on ajoute des données visibles (et cachées) dans le livre (métadonnées), comme le nom de l'acheteur : incitation à la responsabilisation du lecteur qui a acheté le livre (si le livre se retrouve en ligne, on pourra retrouver le nom de celui qui l'a partagé).
b) Le texte doit être recomposable : La mise en page doit s'adapter à l'écran (ordi 4000 px/téléphone 400 px), le format PDF , n'est pas recomposable, il ne s'adapte pas. On parle de documents "accessibles" que tous les sites, depuis 2005 doivent mettre en place. W3C dicte des normes d'accessibilité par exemple pour "montrer" une photo à une personne aveugle (l'image sera décrite à travers le texte). c) Le texte doit être conservable : "Code is law" : le nouveau pouvoir est dans les algorithmes

II) Manipulable :

a) Contenu qui doit être Indexable et cherchable : "Robots.txt" : petit fichier qu'on met à la racine du serveur et qui dit au moteur de recherche les fichiers/contenus qu'on ne peut pas indexer. Robot de moissonnage agressif. "Sitemap" ne s'adresse pas aux humains mais aux machines. Débat autour de la loi numérique : sur le TDM (Text and Data Mining).
b) Copiable et collable : Livres en Streaming (pas possible de copier/coller) donc pas manipulable. Protection morale (droit de paternité de l'oeuvre, à vie) et patrimoniale (droit d'exploitation de l'oeuvre, on doit céder une partie de ces droits à l'éditeur, mais il faut mentionner les supports/ contient aussi le droit de traduction) grâce aux droits d'auteur. Lawrence Lessing qui a inventé les licences en Creative Commons (déclaration de façon unilatérale, pour une possible autorisation d'exploitation du travail perso, dans n'importe quel contexte à condition que l'auteur soit cité). "CC BY" / "CC BY NC" --> pas d'utilisation commerciale dans le cadre de la licence. Si refus de la modification de l'oeuvre : "CC BY NC ND" --> ND = non dérivative. "CC BY NC SA" : partage dans les mêmes conditions de la production finale (sous la même licence). Wikipedia : "CC BY SA" : pour que les contenus soient le plus réutilisés, autorise l'exploitation commerciale. On peut copier/coller avec une licence CC à condition de citer l'auteur.
c) Annotable et Inscriptible : L'annotation doit être dans un format ouvert.
====III) Citable :==== pour être citable un texte éclectronique doit être : a) Identifiable : on doit pouvoir donner un identifiant unique au texte : l'URL ; exemple calepin de notes (numéros de téléphone) : résolution de nom (on transforme le nom en numéro ou le numéro en nom). DNS (Domain Name System). Trace route (résolution de nom entre nom du site et adresse IP, montre le chemin que parcours la demande pour arriver au serveur ??). On doit apprendre à lire les URL de droite à gauche. Celui qui a l'autorité de nommer, de donner le nom est à droite (TLD) ".fr"