BahriOpenEdition

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche

I Edition Numérique

Pas edition ouverte mais tirage illimité (domaine du numérique) normalement tjs tirage limité (domaine du papier)

II Les paradigmes economiques

a)ancien paradigme:

Economie de la rareté on vend, on se dépossède bien rival je le perd (l'objet)

b)nouveaux paradigme:

Economie de l'attention

  • On ne se dépossède pas (ex pdf)
  • Bien non rival (le savoir-le feu) on le transmet sans le perdre
  • Attention rare, attirer l'attention du lecteur est difficile

(presse en difficulté a cause de ce changement continue a mettre une barrière un paiement mais si la concurrence offre gratuité alors aucune raison d'aller au premier) mediapart paradigme de la rareté, aucun open access besoin de contenus spécifiques (buzz) liberation hybride une partie du contenu sous abonnement et une autre ouverte ==> revenu numérique bas Radio France, nouveau président directeur général ==> podcast payant

"le fremium" Newyorktime,** freemium**, (/!\ jeux, on peut finir le jeux sans payer a ne pas confondre avec le pay to win) (dropbox, 5 ou 8% paient pour avoir plus de contenue donc freemium) l'attention peut être apporter par la gratuité du fremium (5 8% quand le freemium marche)

le probleme de l'edition c'est que le fremium est compliqué: on ne peut pas cacher une partie du texte il faut donc trouver une facon de creé de la rareté sans alteré le contenu

newyorktime, cookie permet de savoir combien d'articles sont lu, à partir de 10 articles dans le mois, le contenu est bloqué jusqu’à la fin du mois. le systeme est non violant (cookies effaçables) b2c cout de transaction: le temps qu'on passe a faire une transaction ( rapport entre l'apport et la procédure)

openedition Analyse, recherche scientifique, b2b, on s'adresse à des bibliothèque, usage intensif==> service au professionnel on ne vend pas de contenus mais des services gratuit en HTML et payant fichier pdf et EPUB(format spécifique) formation ect. les chercheurs ont envie d'avoir une bibliothèque (cible étudié) il arrive qu'ils écrivent hors connexion

accée gratuit pour attirer l'attention et vente interne https://www.openedition.org/ secteur public secteur privée edition de l'eclat

III histoire de l’édition électronique

wikipedia 15ans le modèle le plus achevé d’édition Electronique blog fin20ieme encarta 1993 1971 projet Gutenberg un étudiant américain utilise une machine, ou il écrit la déclaration d’indépendance et la partage par mail https://fr.wikipedia.org/wiki/Projet_Gutenberg 1949 le père Roberto Gusa il étudie la théologie et fait un index https://fr.wikipedia.org/wiki/Roberto_Busa

trois temps 3 ages qui ne se detruisent pas les uns les autres:

numérisation:

gutenberg, Busa, gallica (http://gallica.bnf.fr/), google books ==>fouille de texte/text mining on sort du texte des informations apres les avoir numerisé ex:google, google ngram(travaille sur le corpus de google books OCER (reconnaisance optique de caractere) permet de détecter les caractères l'outil permet de rechercher des mots et en ressortir des grandes tendances 1 default = on ne connait pas le corpus. Open edition lab: Bilbo le petit robot , algorithme a qui on apprend a comprendre des normes de texte (ex: Langouret.G. (1968) ) comme base d'apprentissage (3000 fois) pour mesurer ces capacités 92 à 97% ==>se rapproche de quelque chose de fiable. Aujourd'hui il enrichie automatiquement les textes

Edition nativement numérique:

PAO 1984(macintosh) WySIWYG= on code pour avoir du gras par exemple avec ça on à un bouton pour avoir le gras mais des balises reste caché SSP ==>apparition du multi-support, rupture de charge , le workflow(circuit de l'edition) lineaire passe avec le multi support on a rupture de charge (changement de moyen/support) qui on des coûts et augmentent les delais:

  • interopérabilité: réferencement via les meta données (données dans les données)
  • interop:fulltext
  • formats dédiés
  • Archivage à long terme

FDCTT(faire et defaire c'est tjs travailler) on doit a chaque fois faire un travail manuel repetitif et long SSP=(single source)un systeme d'information pensée par un architeque des syst d'info capable de prendre en charge un systeme d'information liée a plusieurs format souvent en XML car format le plus sémantique. Il n'y a plus qu'a choisir les particularités des différents formats/supports.

Edition nativement en réseaux:

wikipédia, infobox(synthèse structuré), onglet modifier(WYSWYG) et modifier le code, on peut contrôler le contenu système de vote et d'arbitrage elle s'appuie sur le nombre d'utilisateurs et de producteurs consommable- retrolien=site A fait un article site B cite A envoie un ping si A accepte le commentaire un lien est crée massivement collaboratif


Le texte électronique idéale

  • mobile
  • multi-support
  • répond à l’économie de l'attention
  • modifiable
  • commentaire
  • bien non rival/reproductible sans (quasiment) de coût spécifique
  • collaboratif
  • "ouvert a tous"
  • interactif
  • indépendant de la distance
  • dématérialisé/quasiment immatériel (data center salle contenant des serveur-consomme énormément d'énergie tout le temps)
  • circule avec bcq de fluidité
  • multi couche:le document n'est pas figé (note marginal sur livre) base=texte + metadonnées=toute les autres couches (metadonnées bibliographique- annotation lecteurs types mot clé,-annotation public type commentaire, retrolien,- annotation automatique provenant du texte mining - données analysé par google fréquentation, vitesse du site, Page Rank (une note donnée a toute les pages web par google visite et liens)de 0a 10 difficile a atteindre permet le référencement

algorithme panda (contrer les fermes de contenus, c'est à dire le duplicates contents ou on copie du contenus sur le site- algorithme penguin SEO(shearch enging optimisation) contre le ferme de lien qui cherchent a faire monter le page rank -si le site est mobile friendly (responcive) il est avantagé sur les non responcive.

-hyper textuel: wikipedia les liens -indexable: index les contenus

3gds qualités:=

 *lisible:
  -le texte doit être dans un format ouvert cad utilisable par tout le monde et dont les specifications techniques sont connus comme HTML (web et format de rendu interpreté du code wiki qui à une semantique plus puissante que le format HTML). Reverse Engeneering. XML,TXT, RTF, DOCX, EPUB (problemes de DRM digital right management cad crypté le fichier carré au lieu des accents le rend illisible si vous n'avez pas les droits pour éviter la concurrence matériel systèmes qui change le paradigme de la relation lecteur / éditeur ) 

Water Marking (l'article est marqué donc on sait qui la acheté pour avoir le responsable en cas de piratage mais n’altère pas la lisibilité contrairement aux DRM) Application dépendant de l'environnement ne permette pas la lisibilité.

  -Recomposable la mise en page s'adapte aux terminaux (pdf non recomposable car pensé pour l'impression) (epub le texte reste lisible même en agrandissant) pour être accessible au aveugle et mal voyant en accord avec les normes du W3C (balise alt=desription textuelle de l'image ou la navigation sanc souris avec le clavier une touche a la fois)
  -Conservable (Bruce Willis a acheté une gde bibliotheque musical sous DRM parcequ'il ne pouvait pas transmettre a ses enfants fake pour faire comprencre le probleme) (Code is law Lessig les algorithmes décident de régles)
  -Manipulable
   *Indexable et cherchable par les moteurs de recherche, ROBOTS.TXT fichier a la racine du serveur qui contient instruction pour les moteurs de recherche (dire ce qui peut ou ne peut pas être indexé contre le moissonage agressif qui font les archivages trop fort et surcharge les serveurs, aussi contre les mauvaises pratique de concurrence)(sitemap.XML contient des localisations)(user agent permet de guider l'indexation

La loi numérique= comportait une exeption au droit auteur aux TDM(text and Data Mining) google index sans contrat.

   *Copiable et collable: le pdf n'est pas prevu pour. certain site web interdissent le copié collé. le droit d'auteur protege dés le moment de la creation et 70ans après votre mort ave protection morale (on reconnait la paternité de la création) et patrimoniale( droit d'exploitation de l'oeuvre) le CC (creative common) le créateur peut decidé de l'utilisation des contenus permet de créer des licences a la carte (CCBY condition de cité l'auteur - CCBYNC cité et pas commercial dans le cadre de la licence - CCBYNCND cité non commercial et non altération - CCBYNCSA si on utilise on oblige a rendre dans la même licence) (ex wikipedia CCBYSA pour que les contenus soient utilisé au maximum) libre de droit lorsque c'est dans le domaine public le CC0 est libre de droit.
   *Annotable et inscriptible (amazon DRM 1984)le DRM peut detruire les annotations
  -citable:
   *Identifiable, (url plus couramment utilisé) DNS(domaine name systeme avec nom du site et adresse ip ex:yahoo.fr/197.22.17.34 permettant d'aller de serveur en serveur jusqu'a yahoo pour revenir avec la reponse.

DNS .fr=top level domaine gerer par l'etat ici francais yahoo=le domaine m(mobile)=sous domaine de la droite vers la gauche par ordre d'autorité le reste c'est du SIO mais pose pb pour cité on utilise des reducteur d'url (internet archive 301work.org

    *Correctement decrit

lui donner une forme e des meta données qui soient interpretable:

       -caractères bien encodé:

ASCII puis UNICODE(100aine de milliers de code pour unifié tout les jeux de caractère du monde) il faut qu'il soit encodé en unicode Decrire sur le format, bien le renseigner méta données (dublin core= 15 attributs pour décrire un document numérique compris par bcq de machine zotero utilise les metadonnées caché dans la page dont dublin core ex star wars 7

-DC.title="Le reveil de la force"
-DC.title lang= "fr" 
-DC.title lang="fr"="star wars 7"
-DC.title.subtitle=lang="fr"=le reveil de la force"
-DC.title lang="fr"="star wars 7. le reveil de la force"
-DC.title.subtitle=lang="en"="theforce awakens"
-DC.creator="J.J.Abrams"
-DC.contributor="J.J.Abrams"
-DC.contributor="KyloRen"
-DC.Subject scheme="DDC"
-DC.date scheme="w3cdtf"="2015-01-16"

Interopérable

  • 1er sens utilisation non dependant de la platforme
  • 2eme sens capacité de 2 machines a communiquer entre elles (ex retrolien)

A(machine de contenus) B(mmachines de service) A envoie les infos a B pour qu'il produise le service.

Aaron Swartz voir le documentaire! 10sources RSS -creapills -la reclame -marketing professionel e-commerce -press citron -il était une pub -MAM -centre pompidou -science et avenir -les inrocks crée compte feedly et diigo tweetdeck

OAI-PMH (open arche initiative protocol for metadata harvesting protocole qui permet l'interopo entre un moissoneur et un entrepot via des verbes (instruction) posé à l'entrepot isidor moteur de recherche en science humaine et sociale plus precis et donc plud fin que google il prend la meta données auteur.


Workflow =site web produit rss=>ajouter sur feedly==>pour être lu systeme d'information= l'ensemble des informations du systeme (entreprise) cad les info, leur structures et l'ensemble des traitement qu'on lui impose l'addition de tout les workflow

IV Les bonnes pratiques web

  • mauvaise pratique "le cliquez ici" pour en savoir plus avec le ici cliclabe car le ici decrit du coup bcp de sites
  • opquast.com

marin.dacos@openedition.org créer un compte dans wikipedia 4 caractères minimum

contribution

contribution wikipedia= https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Contributions/DocMilas nom= DocMilas