Projet Pro Lucie

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche

Idée du projet

Mon projet professionnel va s'orienter vers la communication de festival et plus précisément sur celle du festival Les Sucs en Scène. C'est un événement musical qui proposera sa troisième édition en 2016.

Contexte du festival

Ce festival est organisé par l'association Des Pieds Des Mains. C'est une groupe d'amis habitant en Haute-Loire pour la plupart, qui est à l'origine de cet événement.
Etant également altiligérienne, je connais certains de ses membres et j'ai aussi pu assister aux deux premières éditions.


Suivi de projet- Marin DACOS- notes du cours

Initiation à l'édition électronique

économie de la rareté ; économie de l'attention
Différents modèles développés par OpenEdition : modèle freemium (le plus connu : dropbox), skype était un modèle freemium (ex du New-York Times-B2C)
Coûts de transaction dans le numérique
Création de services aux professionnels pour usages intensifs, gratuit (exemple Bibliothèques universitaires - B2B). Fichiers PDF et EPUB
Bien non rival : quand on les donne on ne s'en dépossède pas (ex: la connaissances); Bien rival : quand on le donne on s'en dépossède (un stylo)

Histoire de l'édition électronique : Wikipedia : modèle le plus achevé de l'édition électronique 1971 : projet Gutenberg : partage à travers des caractères majuscules (encodés ASCII avec 255 caractères disponibles), de la déclaration d'indépendance des Etats-unis. 1949 : Père Roberto BUSA (ecclésiastique italien) étudie les écrits sacrés et réalise un index : Index Thomisticus avec l'aide d'IBM, 56 volumes édités, les données existent toujours Histoire de l'édition électronique se décompose en 3 temps :

1) La numérisation :

GALLICA ; Google Books ; data mining (fouille de données) : explorer des données pour extraire une info supplémentaire ; Text mining (fouille de texte) : pour décréter la langue d'un texte et sortir du texte de livres (texte qui doit être numérisé au départ). Le plus connu : Google Ngram : fonctionnement : ROC (reconnaissance optique de caractères) Sites de numérisation : Persee.fr et Jstor.org

2) Edition nativement numérique :

On entre dans une édition multisupports. Utilise des fichiers numériques dès le début (PAO), date du milieu des années 80 (1984 avec apparition Mac), "What You See Is What You Get", encodage sémantique. WYSIWYG : on voit graphiquement ce qu'on va obtenir. Gros défaut : on ne maîtrise pas le code qu'il y a derrière (il y a des données cachées). Dominique Roux : Multi-supports pose problème car on a une rupture de charge dans le Workflow du livre (circuit de traitement), des différentes formes qui interviennent dans le support. Rupture de charge : logistique = transport ; on doit transporter la charge sur un autre véhicule (entraîne des coûts supérieurs) Metadonnées : données sur les données, ex sur un livre : auteur, poids, prix, etc. Dublin Core FDCTT (faire et défaire c'est toujours travailler) SSP (single source publishing) : système d'information qui est pensé par un architecte des systèmes d'informations (pas de système de charge), s'appuie sur une seule source, on entre dans un modèle avec un format pivot (XML). Une seule source qui est la matrice de tous les autres formats. En SSP on essaye d'éviter toute rupture de charge. Format PAO : centré sur l'apparence, la forme finale

3) L'édition nativement en réseau/en ligne :

c'est le troisième âge de l'édition électronique (ex :Wikipedia). S'appuie sur le nombre d'utilisateurs et de producteurs, elle est commentable. Rétrolien : lie deux articles grâce au Ping (équivalent du Poke sur Facebook), lorsqu'un article est cité dans un autre, on retrouve le Ping qui permet de retrouver les deux articles (l'un via l'autre). Infobox : synthèse structurée sur une page Wikipedia. Guerre d'édition

===L'édition numérique, c'est (propriétés intrinsèques) :===

- mobile
- multiformat/ multisupport
- économie de l'attention
- modifiable
- commentable
- bien non rival
- collaboratif
- "ouvert à tous" différent du deep web (face invisible d'internet)
- interactif
- proche = indépendant de la distance

Caractéristiques du texte numérique :
1-dématérialisé (quasiment immatériel) - DATA CENTER : salles qui contient des centaines de milliers de serveurs -
2-reproductible
3-circule avec une grande fluidité, peut se doter de couches successibles

mail : marin.dacos@openedition.org (envoyer compte wikipédia (nom de l'utilisateur) qu'on aura créé, et modifs qu'on a réalisées : fautes corrigées, ajout d'informations, etc. sur au moins 4 caractères)

(suite) Jeudi 14 janvier

4-Multicouches : Toutes les autres couches informationnelles en dehors du texte sont des métadonnées : métadonnées bibliographiques; annotations du lecteur (mots clé, résumé, --> DIIGO); annotations par commentaires publics, rétrolien; annotations automatiques (textmining); page rank : mesure la notoriété entre 0 et 10, en fonction des liens recherchés vers les pages.
Principes du Page Rank : mesure aussi le nombre de clics, principe rétro-lien, vitesse, nombre de clics et donc fréquentation des sites web.
Algorithme PANDA de Google : repère les fermes de contenus (pirates de contenus); détectent les "Duplicate contents" et les sanctionne (en lui donnant un Page Rank de 0, apparaît donc tout au fond des pages de résultats)
PINGOUIN : même principe que PANDA mais pour les liens (SEO : Search Enging Optimisation) : sites de ferme de liens sont condamnés par google Donc l'ensemble des contenus vers d'autres sites peut avoir un impact sur notre page.
Mobile friendly (facile à consulter sur un téléphone ou une tablette) Le texte est seulement un petit morceau des couches informationnelles qui qualifient le texte (sa confiance, sa notoriété, sa visibilité, etc.)

5- Hypertextualité du texte
6- Le texte numérique est index-able : indexation du livre ou des contenus par des tiers, qui produit des commentaires par-dessus
7- Le texte numérique relève de l'économie de l'attention et pas de l'économie de la rareté

Le texte électronique idéal :

3 grandes qualités :

I) Le livre/texte/billet de blog/notice, doit être lisible :

a) Le texte doit être dans un format ouvert : format dont les spécifications techniques sont connues, permettant à tout le monde d'utiliser ce format (le consulter) : exemple : HTML : format ouvert par excellence ; Le code Wiki est interprété et donne du HTML ; Autres formats ouverts : XML, EPUB, DOCX, RTF, JPG, TXT, . DRM (Digital Rights Management) : cryptent le fichier (le rendent illisible), système de verrou numérique qui crypte le livre et ne le décrypte qu'à une condition : que le système avec lequel on le lit ait acquis la condition, les droits pour la lecture. Le système contacte donc le vendeur pour savoir si l'acheteur a bien acquis les contenus, droits, pour le lire, si non, son achat sera illisible. NUMILOG : système de DRM qui prévoit de supprimer le livre dans un temps donné (au bout d'une semaine par exemple).
Avec les DRM changement de paradigme au niveau des éditions, choisir le livres sans DRM
Autre solution de protection compatible avec la lisibilité : le WaterMarking : on ajoute des données visibles (et cachées) dans le livre (métadonnées), comme le nom de l'acheteur : incitation à la responsabilisation du lecteur qui a acheté le livre (si le livre se retrouve en ligne, on pourra retrouver le nom de celui qui l'a partagé).
b) Le texte doit être recomposable : La mise en page doit s'adapter à l'écran (ordi 4000 px/téléphone 400 px), le format PDF , n'est pas recomposable, il ne s'adapte pas. On parle de documents "accessibles" que tous les sites, depuis 2005 doivent mettre en place. W3C dicte des normes d'accessibilité par exemple pour "montrer" une photo à une personne aveugle (l'image sera décrite à travers le texte). c) Le texte doit être conservable : "Code is law" : le nouveau pouvoir est dans les algorithmes

II) Manipulable :

a) Contenu qui doit être Indexable et cherchable : "Robots.txt" : petit fichier qu'on met à la racine du serveur et qui dit au moteur de recherche les fichiers/contenus qu'on ne peut pas indexer. Robot de moissonnage agressif. "Sitemap" ne s'adresse pas aux humains mais aux machines. Débat autour de la loi numérique : sur le TDM (Text and Data Mining).
b) Copiable et collable : Livres en Streaming (pas possible de copier/coller) donc pas manipulable. Protection morale (droit de paternité de l'oeuvre, à vie) et patrimoniale (droit d'exploitation de l'oeuvre, on doit céder une partie de ces droits à l'éditeur, mais il faut mentionner les supports/ contient aussi le droit de traduction) grâce aux droits d'auteur. Lawrence Lessing qui a inventé les licences en Creative Commons (déclaration de façon unilatérale, pour une possible autorisation d'exploitation du travail perso, dans n'importe quel contexte à condition que l'auteur soit cité). "CC BY" / "CC BY NC" --> pas d'utilisation commerciale dans le cadre de la licence. Si refus de la modification de l'oeuvre : "CC BY NC ND" --> ND = non dérivative. "CC BY NC SA" : partage dans les mêmes conditions de la production finale (sous la même licence). Wikipedia : "CC BY SA" : pour que les contenus soient le plus réutilisés, autorise l'exploitation commerciale. On peut copier/coller avec une licence CC à condition de citer l'auteur.
c) Annotable et Inscriptible : L'annotation doit être dans un format ouvert.

III) Citable :

pour être citable un texte éclectronique doit être : a) Identifiable : pour être citable, le texte électronique doit être identifiable. on doit pouvoir donner un identifiant unique au texte : l'URL ; exemple calepin de notes (numéros de téléphone) : résolution de nom (on transforme le nom en numéro ou le numéro en nom). DNS (Domain Name System). Trace route (résolution de nom entre nom du site et adresse IP, montre le chemin que parcours la demande pour arriver au serveur ??). On doit apprendre à lire les URL de droite à gauche. Celui qui a l'autorité de nommer, de donner le nom est à droite (TLD) ".fr" On utilise l'URL qui fonctionne sur le Domain name system le chemin utilisé par les paquets de données s'appelle le trace route.

On lit une URL de droite vers la gauche : TLD = top level Domain (ex .org, .fr, .com...) le .com dépend d'Icann domain (ex Yahoo) sous domain choisi par le domaine

en cas d'URL longue, la prendre, aller sur TinyURL.com et on me propose de la raccourcir 301 works porpose un système d'archivage des réducteurs d'URL

b) Pour être citable, le texte électronique doit être correctement décrit. = lui donner une forme et des méta données qui sont interprétables. Les caractères doivent être correctement encodés. Code ASCII contient 245 caractères. Maintenant, Unicode. dizaines de milliers de valeurs qui permet de mettre en place une coordination mondiale. Consortium mondial qui décide qu'un code unique décrit un caractère unique. Depuis 2000, les docs Word sont en unicode Il faut aussi choisir et renseigner correctement le bon format. les métadonnées : les dublin core = format de méta donnés. 15 balises différentes pour décrire un doc numériques. DC.Title = " le reveil de la force" Dc title lang ="FR" dc title lang = "FR" = Star wars 7. le reveil de la force" dc creator = "J.J.Abrams" dc subject scheme ="DDC" dc date scheme = "w3cdtf"="2015-01-16"


c) le contenu doit être interopérable = permet une utlistation indépendante de la plateforme sur lequel on veut le lire. Ex : on peut télécharger un format et le lire sur un ipad et qu'on puisse aussi le lire sur une autre tablette android. Mais autre sens ici, capacité de deux machines de communiquer entre elles. le retro lien est un système basique d'interopérabilité. Il y a aussi le RSS compétences de veille. détécter les évolutions de notre environnement pour être dans l'anticipation le flux RSS permet la veille qu'il faut pratiquer chaque jour.

Aaron swartz. invention du format à 14 ans où sont les flux RSS ? (cf film sur lui)
En bas des pages, icones orange. Choisir le flux, copier coller sur feedly le protocole le plus abouti d'interopérabilité c'est le OAI- PMH (OPEN ARCHE INITIATIVE PROTOCOL FOR METADATA HARVESTING) protocole qui permet interopérabilité entre entrepôt qui produit données et moissonneur qui les collecte. On passe par des verbes qui sont des instructions, des questions que les moissonneurs posent aux entrepôts. première question : qui es-tu ? ensuite : le format (question = ListMetadataFormats) la structure
Outils de veille :

WORKFLOW : regroupe les flux RSS des sites sélectionnés, le modèle SSP en est un
Système d'informations : ensemble des infos qui structurent l'entreprise


créer un compte diigo
mon adresse : https://www.diigo.com/user/lucie-michel- trouver un des Bots de wikipedia et trouver son rôle
Bot : https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Bot/Liste https://fr.wikipedia.org/wiki/Utilisateur:Arkbot
Arkbot : missions : Consolidation semi-automatique des infoboxes, catégories, interwikis et paragraphes d'introduction. Détection automatique de vandalismes sournois. Détection de spam

Bonnes pratiques du web

" Cliquez "ici" " --> pas bien : pour une raison d'ergonomie, toute petite zone cliquable, faible accessibilité ; ne contient aucune information ("cliquez ici" : discours sur le discours, pas de sens dans le lien). Si les liens sont bien qualifiants, en termes : meilleur référencement
Entreprise OPQUAST : ont listé les bonnes pratiques du web, possibilité de consulter leurs livres en ligne, en fonction des thèmes (à lire).
Eléments de syntaxe du wiki (guide envoyé par mail). Aide sur la wikification.







Lucie Michel : édition électronique