Open Edition Julie

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche

Intervenant

Intervenant Marin Dacos, créateur de openedition.org

OpenEdition : Qu’est-ce que c’est?

OpenEdition: plateforme destinée au tirage illimité en ligne.

Différents modèle

Economie de la rareté

L'édition repose sur l'économie de la rareté, du bien fait qu'il est très demandé et, en contre partie, peu disponible sur le marché. Il en acquière donc une valeurs inestimable. La différence par rapport au numérique est que, dans un format numérique, le propriétaire ne se dépossède pas de son bien, et peu le partager à l'infini.

Economie de l’attention

L'économie de l'attention: il est dans le cas du numérique, difficile à l'ouvrage, bien d'attirer l'attention du lecteur/consommateur. La crise de la presse écrite en est un exemple d'actualité. La mise en place d'un abonnement à un journal web ferait que les consultations en ligne diminueraient sensiblement. Certaine exception existent, comme par exemple Mediapart, en ayant adopté le modèle de la rareté, et imposer l'abonnement des le départ. La plupart des grands titres ont opté aujourd'hui pour un modèle hybride; laissant les articles ordinaire ouverts au public, et conditionnant la consultation d'autres article par un abonnement. Deux notions importantes, biens rivaux (quand je les donne, je m'en dépossède ex: stylo) biens non rivaux (quand je les donne, je ne m'en dépossède pas ex: la connaissance)

Modèle Freemium

D'autres modèles sont développés par OpenEdition, comme le Freemium (version d'essai, free = gratuit et mium = premium). Le freemium (mot-valise des mots anglais free : gratuit, et premium : prime) est une stratégie commerciale associant une offre gratuite, en libre accès, et une offre « Premium », plus haut de gamme, en accès payant. Ce modèle s'applique par sa nature aux produits et services à faibles coûts variables ou marginaux, permettant aux producteurs d'encourir un coût total limité et comparable à une offre publicitaire. "Pay to win" ne fait pas parti du modèle freemium, Skype était un produit freemium.

Le New York Times compte le nombre d'article qu'on a lu pendant le mois, (articles du journal). C'est à dire qu'au bout de 10 articles, le 11ème n'est pas entier, il faut payer. Mais ce dispositif a des limites. Dispositif du cout de transaction.

B2B: Business to Business, modèle économique que la plateforme à adopté en opposition au B2C Business to Consumer, comme celui du NYT), on va considéré que l'usage intensif est l'usage professionnel., en proposant ses services aux bibliothèques universitaires par exemple.

E-PUB (format spécifique aux tablettes).

Workflow :circuit d’info structuré qui va d’un point A à un point B. N’est pas spécifique au web. OJS Workflow Chart -> voir schéma http://www.psychopen.eu/fileadmin/user_upload/documents/guidelines/OJS_Workflow_Chart.pdf

Quelques plateformes créées par le CNRS: Revoues.org Calenda.org Hypotheses.org Books.openedition.org

Brève Histoire de l’Édition

1971 : projet Gutenberg (https://translate.google.fr/translate?hl=fr&sl=en&u=https://www.gutenberg.org/&prev=search) est le projet un des plus ancien, de plateforme de partage d'ouvrage en ligne, datant de 1971. Le père Roberto Busa est l'un des acteurs majeurs d'IBM (https://fr.wikipedia.org/wiki/Roberto_Busa).

1er age: La numérisation

GoogleBooks: en 2005, Google se lance dans la numérisation d'ouvrages. DataMining (permet d'extraire de nouvelles données et de renseignement, par la fouille de textes). Ex: Google fait de la fouille de texte grâce à GoogleIngram : OCR ou ROC (Reconnaissance Optique de Caractère) Tous ces outils sont des outils du CNRS.

2ème age: Édition Nativement Numérique

"Si le livre avait été inventé après l’ordinateur il aurait constitué une avancée majeur. Ses qualité sont remarquables :légèreté, disponibilité, faible cout, fonctionnement sans consommation d’énergie, qualité d'affichage. De plus, le livre constitue une interface particulièrement bien adaptée à l'homme. Le cerveau de ce dernier possède en effet une excellente mémoire spatiale, qui lui permet de localiser approximativement une information ou une page après lecture. »

Rupture de charge: vocabulaire de logistique, de transport, d’un point A à B toujours même véhicule, mais si on change de véhicule, transvaser le chargement dans un autre véhicule. coute le l’argent. (SSP = exemple 4ème de couverture, si on doit changement sur plusieurs formats = rupture de charge.)

Metadonnées (données sur les données) ex pour livre (titre, nbr de page, sous titres, auteur… DUBLIN CORE 8 usages du même texte

FDCTT (Faire et Défaire C’est Toujours Travailler) notion de M. Dacos. 2ème SSP (Single Source Publishing) = système d’information pensée par un architecte de système d’information où tout est relié sans rupture de charges. Format de pivot (XML) capable de produire n format différent, print ou numérique et un changement est propagé dans tous les supports. Une seule source qui permet de tout modifier, et on quitte le FDCTT. Formats centrés sur l’apparence, la forme finale. Je connais le fond, qui est au début, au pivot et ensuite je vais avoir pleins de forme. Dans un second temps, pur ne pas confondre la structure du document avec son apparence. Support dépend des usages que l’on peut avoir (tablette, html …) Format auteur -> édition -> diffusion

3ème age: Edition nativement en réseau

Cohabite les trois âges, édition collaborative. Commentable, rétrolien, inventé par les blogs. On peut citer un article à travers les blogs, ainsi l’article cité reçoit un PING (comme poke fb) qui pourra renvoyé un « rétrolien ». Les deux article seront lié. Infobox = synthèse structurée Wikipédia, dispositif collaboratif et transparent (toutes les document avant modification sont archivés). Wikipedia déclenche une guerre d’édition où chacun essaye de convaincre donc va se mettre en place des systèmes d’arbitrage meurtres, de régulations collectives.

Les caractéristiques de base du texte électronique

Multiformat / multisupport : Dans le monde du numérique on entre dans un monde multifactoriel, multidimensionnel et multicouches. Circule avec une très grande fluidité - Peut se doter de couches successives Au-delà du texte, nous pouvons avoir d'autres types d'informations : les métadonnées. Toutes les couches sont des métadonnées.

METADONNÉES

  • métabiblio
  • texte
  • annotation commentaire et rétrolien
  • annotation lecture (mots clé, …)
  • annotation automatique : textmining (fouille de texte: ex: trouver que des pages en français)
  • PR (Page Rank: ne mesure pas la qualité mais la notoriété sur 10) : Le PageRank ou PR est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d'une page web. Le PageRank n'est qu'un indicateur parmi d'autres dans l'algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée.). La vitesse est l’un des critères important pour que les sites élèvent leur PR. Quand on clique sur un article, on « vote pour le site ».Grâce aux cliques, google peut modifier la fréquence.

Algorithme PANDA (contrer les fermes de contenus site qui copie colle les contenus d’autre site officiel) il cherche les duplicatas contents pour les sanctionner avec un PR de 0 ce qui met le site en question tout à la fin des pages de recherche). SEO Search Engine Optimisation L’optimisation pour les moteurs de recherche,, est un ensemble de techniques visant à optimiser la visibilité d'un site web dans les pages de résultats de recherche (les SERP, pour Search Engine Result Pages). Ces techniques cherchent à améliorer la compréhension par les robots d'indexation de la thématique et du contenu d'une ou de l'ensemble des pages d'un site web et à en augmenter ainsi le trafic naturel. L'objectif de ce procédé vise à améliorer le positionnement d'une page web dans les pages de résultats de recherche des moteurs sur des mots-clés ciblés (correspondant généralement aux thèmes principaux du site). On considère que le positionnement d'un site est bon lorsqu'il est positionné (classé) en première page des résultats de recherche, dans l'une des dix premières réponses d'une recherche sur des mots-clés correspondant précisément à sa thématique.


Mobile friendly : signifie généralement un site qui a été conçu pour une navigation optimisée et un affichage optimal des blocs de contenus (images et textes) sur smartphone.

hypertextualité, le texte lui même renvoie à d’autre texte. Dans wiki, force de l’hypertextualité, comment sont fait ces liens?

Le texte numérique vient de l’économie de l’attention et pas de la rareté.

Qualités idéales du texte électronique

Lisible

Formats ouverts

le texte doit être dans un format ouvert -> html (le format de wiki est codé d’abord en codewiki puis interprété en format de rendu html). Le code wiki permet de sortir plusieurs formats.

  • PDF
  • Reverse Engineering : La rétro-ingénierie, ou ingénierie inverse ou inversée, est l'activité qui consiste à étudier un objet pour en déterminer le fonctionnement interne ou la méthode de fabrication. On parle également de rétroconception.
  • EPUB
  • DRM (Digital Rights Management) = Sigle signifiant gestion des droits numériques (Digital Rights Management). Technologie sécurisée qui permet au détenteur des droits d'auteur d'un objet soumis à la propriété intellectuelle (comme un fichier audio, vidéo ou texte) de spécifier ce qu'un utilisateur est en droit d'en faire.Évite la concurrence. On achète des contenus fait pour être illisible. Numilog entreprise française vend des livres qui sont détruit après un certain laps de temps.
  • Notion de protection qui est plus respectable que le DRM : Watermarking, on ajoute dans le livre des données visibles et cachées.
  • RTF
  • DOCX
  • TXT
  • XML
  • JPG

Recomposable

Accessibilité : la mise en page ne s’adapte pas au mode de lecture (ex taille du texte, de l’écran). format EPUB s’adapte à l’écran, il est accessible. C’est une norme qu’on appelle l’accessibilité que les sites doivent être respecté depuis 2005. (C’est comme les rampes handicapées.) W3C World Wide Web Consortium qui est une organisation non lucrative permettant définir des standards pour les technologies liées aux web. Le W3C a été fondé en octobre 1994 par Tim Berners-Lee qui n'est autre que le co-inventeur du Worl Wide Web. Son président actuel est par ailleurs Tim Berners-Lee. Aujourd'hui cet organisme supervise un ensemble de standards tel que HTTP, HTML, xHTML, CSS, URL, XML, SVG, PNG et bien d’autres.

Conservable

Aucun livre sous DRM n’est pas conservable (ex: affaire de Bruce Willis) -> Code is Law (Lawrence LESSIG)

Manipulable

Indexable et cherchable

Robots.TXT -> instruction sur l’indexation pour tous les moteurs de recherche. Permet d’éviter le moissonnage agressif.

Copiable et collable

exemple droit d’auteur … paternité de l’oeuvre Lessig invente le CC (creative commons) licence et pas contrat pour réduire ce cout de transaction. Pas d’obligation de deux signataire de deux partis distinct.

Annotable et inscriptible

Citable

Identifiable

Adresse des sites (domaine, sous domaine…) lecture de droite à gauche

Correctement décrit

  • ENCODAGE CARACTÈRES
  • ASCII - unicode
  • FORMAT RENSEIGNÉ
  • MÉTADONNÉES
  • DUBLIN CORE (coeur, version simplifié des métadonnées que l’on dispose) = 15 attributs

Ex: balise « title » = titre DC. TITLE=« Le reveil de la Force » DC.TITLE LANG=« FR »= DCqualifié

DC.TITLE LANG=« FR » = « Star wars 7 »

DC.TITLE.SUBTITLE LANG=« FR » = « Le réveil de la force » DC.TITLE LANG=« EU »=«  Si on veut déclarer deux langues, il faut obligatoirement mettre deux balises. DC.CREATOR=« J.J. ABRAMS » DC.CONTRIBUTEUR=« J.J. ABRAMS » NE JAMAIS METTRE DEUX NOMS DANS LA MÊME BALISE, ON EN REMET UNE. DC.SUBJECT SCHENE =« DDC » DC.DATE SCHEND?E =« W3CTDF »=« 2015-01-16 »

Format interopérable

format qui sera capable d’être lu par plusieurs format. Autre forme d’interopérabilité, = deux machines communique entre elle (ex: rétrolien). Il y a aussi, autre que le rétro lien, le RSS. (sigle venant de l'anglais «Rich Site Summary») est une famille de formats de données utilisés pour la syndication de contenu Web. Un produit RSS est une ressource du World Wide Web dont le contenu est produit automatiquement (sauf cas exceptionnels) en fonction des mises à jour d’un site Web. Les flux RSS sont des fichiers XML qui sont souvent utilisés par les sites d'actualité et les blogs pour présenter les titres des dernières informations consultables.

CONCEPTS à maîtriser

  • OAI-PMH (protocole qui permet d’échanger de données entre des entrepôts (produit les données en vrac) et des moissonneurs (qui va structurer ces données).
  • SYSTEME D'INFORMATION Le système d'information d'une entreprise, c'est l'ensemble des informations que manipule l’entreprise, la structure de ces informations et leur interaction

DIIGO

2 type de pro qui utilise la veille: la momie et le vivant. Il faut prendre l’habitude d’utilisé le dispositif de veille, il permet d’évoluer en même temps que nos relations et domaine de travail. https://www.diigo.com/user/juliezb