Projet pro Charlène

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche

Module suivie de projet. M.Dacos

Introduction.

OpenEdition est un portail de publication des sciences humaines et sociale créer par le centre pour l'édition électronique ouverte.

On passe d'une économie de la rareté (ex. le livre qui est empreinté dans une bibliothèque). à une économie de l'attention et de l'abondance avec le domaine du numérique (livre disponible sur internet parmi une multitude d'autres livres), qui nécessite alors l'attention du lecteur.

Deux modèle (hybrides): accès fermé (payant), accès ouvert (gratuit).

Création d'un nouveau modèle: freemium. "Free": expérience complète du service mais non intense. Ex. Wetransfert limite de 2go. Skype était produit freemium. permet d'ouvrir l'accès à l'utilisation. On essaye d'ajouter le modèle freemium à l'open édition: on donne une sorte de "crédit" au lecteur, ce n'est pas un système violent d'identification (cookies,...). B2C (Business to Consumers) devient B2B (Business to business) pour bibliothèques universitaires: des service au professionnel. L'éditeur ne vend pas les contenus mais les services. En html: open accès.

Usage intensif, la cible c'est le chercheur, qui créer une bibliothèque. par fichier pdf ou EPUB, fichier qui ne sont pas ouvert: bouton télécharger comprend abonnement donc achat.


Ex. Livre de F.Labarthe sur openédition : on peut le voir en ligne: freemium mais si on veut le télécharger en pdf pour imprimer ou l'avoir sans réseau, il faut payer.

Histoire de l'édition électronique

Exemple d'édition d'édition électronique: depuis 15ans, Wikipédia. Encarta support dvd(fin du XXème siècle- 1987), blog (1997), un des plus vieux projet: 1971, projet Gutenberg, étudiant à qui on donne accès à un ordinateur, il tape la déclaration d'indépendance des Etats Unis en Majuscule et les diffuse par l'ancêtre du mail: ASCII (255 caractères disponibles).
Le plus vieu projet: 1949, père Roberto Busa étudie les écrits sacrés et fait l'index Thomisticus avec IBM. Les données existent toujours. Sei automatisme du recensement.
Donc 3 temps dans l'histoires, quand un âge arrive, il n'efface pas le précédent.


* 1er âge de l'édition électronique: La numérisation.

Galica; google book; data mining (fouille de données: explorer des données pour extraire une info supplémentaire), text mining (fouille de texte) : sortir des texte du livre. Le plus connu: "Google Ngram", reconnaissance optique de caractéres ("ROC", "OCR" en anglais), rend visible graphiquement l'utilisation de certains mot sur le corpus google. OpenEditionLAB, Persée.fr et Jstor.org.

* 2ème âge de l'édition électronique: L'édition nativement numérique.

Date du milieu des années 80 avec Macintosh. Encodage, sémantique. PAO, WYSIWIG= on voit graphiquement et directement ce qu'on encode. gros progrès mais on ne sait pas ce qu'on encode. Ruptures de charge dans le Workflow (circuit de traitement- étape de l'auteur jusqu'au circuit final, du livre -traducteur, composition, correcteur etc. Taches traitées en série). La rupture de charge, notamment dans le transport fluviale, si on a pas le bon canal on ne peut pas transporter sans changer de moyen de transport, on change alors le transport. De la mm façon dans la grande distribution. Donc engendre un coût important. Métadonnées: "donnée sur la donnée", Type de donnée qui permet de caractériser et structurer des ressources numériques, telles que celles contenues dans une page web. FDCTT: Faire et Défaire C'est Toujours Travailler. SSP: Single Source Publishing, système d'information qui est pensé par un architecte des systèmes d'informations (pas de système de charge), s'appuie sur une seule source. donc format pivot, format plus sémantique. Habituellement, les éditeurs utilisent un format PAO qui est centrée sur l'apparence. Édition MULTIsupport, plusieurs version du livre. SSP, modèle avec une seule source qui va être la matrice de tous les autres formats (avant c'était Indesign), format beaucoup plus compliquer mais qui permet d'être la matrice du fichier.

* 3ème âge de l'édition électronique: L'édition nativement en ligne (au réseau).

Ex typique: Wikipédia. l'apparition du 3ème âge n'abolie pas les autres âges, les 3 âges cohabitent.

Caractéristiques assez intéressantes:

- Elle s'appuie sur le nombre d'utilisateurs et de producteurs. Commentable (inventé par les blog): nouvel aspect qui arrive avec le 3ème âge. On fait un lien, ça envoie un PING ("on parle de toi", qui est envoyé à la source qui est citée, ex "poke" sur Facebook), dans l'interface de ce qui est cité, le ping apparait comme un commentaire, avec un lien URL indiquant qu'on peut aller lire le commentaire et accepter ou pas de citer ce commentaire: c'est un rétrolien. Wikipédia: Infobox: synthèse structuré sur la page., on peut modifier la page, on eut être en Wiziwig ou en mode code. On peut voir toutes les modification de la page avec l'historique. On peut visualisé les différentes contribution d'un usager de Wikipédia.

Les différentes caractéristiques du texte numérique

- mobile.
- modifiable/ multisupport.
- économie de l'attention.
- modifiable.
- commentable.
- bien non rival. reproductible quasiment sans coût spécifique car consomme quand même de l'énergie.
- collaborative.
- "ouvert à tous" (relatif: deep web, face invisible).
- interactif.
- proche (indépendant de la distance).
- dématérialisée, ("quasiment immatériel" = Data center: salle réfrigéré, climatisé qui consomme énormément d'énergie qui contient des centaines de millier de serveurs).
- grande fluidité.

  • Se dote de "couches" successives. Multicouches vivantes (on peut parler de vie documentaire, il n'est pas figé une fois pour toute):

Toutes les couches sont des métadonnées (données décrivants les données): - titres/auteurs etc: métadonnées bibliographiques. - Annotations lecteurs ( mot clefs, résumés - Annotations "commentaires et rétrolien." - Annotations automatiques: texteminig.

- PageRank: mesure de la notoriété (entre 0 et 10) d'un site par rapport au fait qu'il soit citer sur d'autre site. mesure de nombre de clics donc de fréquentation. - Algorithme Panda de google: fermes de contenu, pour vendre de la publicité, il faut avoir du contenu qui répond au besoin et recherche des internautes: c'est du piratage, des "fausses pages" qui contiennent des "duplicate contents". - "Pinguin", c'est pareil mais pour les ferme de contenu. Métier dans le referencement: SEO.

  • Hypertextualité :

Navigation de page en page sans plan général du web. Le texte lui même renvoie à d'autres élèments. Dans Wikipedia, c'est une forme de cette plateforme. Comment sont fait ces liens: pas les humains ou les machines.

  • Indexable :

Indexation du livre/contenu par des tiers qui obéissent à des logiques différentes.

  • Économie de l'attention (et pas de la rareté).

La Lisibilité

* Format ouvert.

le format dont les spécification technique sont connue permettant a tout le monde de produire le format sans passer par le logiciel de création, sans avoir d'info sur "comment le format est structuré". Le HTML est le format le plus ouvert, code Wiki, interprété donnant lieu au rendu: le html. Le PDF est considéré comme un format ouvert. Permet à tout le monde de lire le format sans passer par les logiciels (codé en Wiki (pivot), interprété et rendu en HTML, Reverse Engineering, PDF, RTF, DOCX, XML, TXT, EPUB, JPG) DRM, Digital Right Management, c’est crypter le fichier, le rendre illisible, c’est un verrou numérique qui se débloque qu’à une seule condition, c’est que le système que l’on a ait le droit de lire ce document, afin qu’on ne puisse pas le lire sur le matériel des concurrents. reverse engeneering Le water marking : façon comme une autre de marquer la trace de l'auteur/vendeur sur le document, sans pour autant altérer la lisibilité du document.


* Format recomposable.

N'altère pas la lisibilité du document. Accessibilité, par exemple pour les aveugles.W3C: définit les normes du web, dictes les normes d'accessibilités. accessibilité avec un clavier (sans souris, touchpad ou quoi), en utilisant une seule touche: pour les amputés par exemple. le texte se plie aux difficultés physiques des lecteurs, il s'adapte aux dimensions de la page ou du support, propose des options d'adaptation aux handicaps des lecteurs (agrandissement des caractères, lecture vocale..)


* Format conservable.

RTF - DOCX - XML - TXT - EPUB (format de livre Èlectronique) - JPEG note = les livres numÈriques achetÈs sur internet sont souvent ÈquipÈs d'un Digital Rights Management, un systËme de cryptage de document afin d'assurer l'achat du fichier. D'autres bibliothËque en ligne adoptent le systËme du livre chronodÈgradable, afin de limiter les partages d'ouvrages numÈriques : code is law.


Manipulable

* Indexable et cherchable

Pour pouvoir faire du textmining dessus (robots.txt c'est un fichier que l'on met à la racine du serveur pour dire au moteur de recherche quel contenu il a le droit de lire ou non). Lois numérique: TDM Text Data Mining, selon la loi numérique, un site possède tout ses contenus et pour les réutiliser il faudra un contrat qui donne une session de droits d’exploitation de ces contenus (protégés par le droit d’auteur). Le droit d'auteur protège l'auteur mais depuis 20ans Google index les pages sans contrat.

* Copiable et Collable

Environnement qui hybride de copier/coller: certains PDF, ce n'est pas contre mais ce n'est pas prévu pour. Couche javascript pour empêcher le clic droit pour interdire le Copier/Coller. Streaming pour livre: on ne peut pas copier/coller. Ce n'est pas une bonne pratique. Possibilité légale de Copier/ Coller. Créative Commons: licence permettant de faire plusieurs action et permettants de réutiliser le contenu. Cadre du droit d'auteur: en France le droit d'auteur existe pendant la création. Document original, créatif: livre, vidéo etc. Lorsqu'on le créer, le droit d'auteur nous protège au moment de la création et tout au long de notre vie. On en jouÏe pendant notre vie et 70 ans après notre mort: registre moral et patrimonial. Le droit moral: on reconnait la paternité de la création. Droit incessible et éternel, rend obligatoire la reconnaissance de la paternité de l'oeuvre. Plus droit à l'exploitation de l'oeuvre. Quand on donne note livre a Galimard, on cède des droit, qui doit comporter une mention du support (livre, papier, internet etc) donc quand internet est apparu, tous les contrat ont du être signée. = registre du droit d'auteur classique. Problème avec ce registre, avec le numérique: cout de transaction. pour exploitation non commercial, il faut une cession de droit qui doit être signé. Donc millier de cas ou ce cout de transaction est disproportionner comparé à l'intention (chercher l'auteur, demander l'autorisation etc), Le créative common cède automatiquement à qui veut l'autorisation d'utilisation. Licence la plus libérale. On déclare que n'importe qui peut utiliser ces créations sur n'importe quel support et pour n'importe quel utilisation à la simple condition que l'auteur soit citer (CC By). On veut interdire les utilisation commercial, toujours CCBy NC (non commercial), le commerce peut alors quand même contacter l'auteur pour procéder à une cession de droit. L'auteur peut aussi décider de refuser la modification : CCBy NC ND (none dérivatif). On autorise modification à condition que le contenu soit diffuser selon la même licence: By NC SA (share alike).

* Annotable et inscriptible

Retour sur notion de concevable : Amazon a vendu le livre 1984, il n'avait pas le droit, il ont détruit le livre à chaque lecteur qui l'a acheter. donc destruction du livre, d'annotation. donc contrôle de nos ordinateurs.

Citable

1. Identifiable

a lire de droite a gauche, le « fr » c’est le TLD et ça veut dire que c’est lui qui autorise yahoo à s’appeler comme ça, yahoo c’est le nom de domaine et ce qui est avant (à gauche de yahoo) c’est le sous domaine .com correspond à l’ICANN, comme .org et pour avoir un nom de domaine on achète à hauteur de 12$ par an

2. Correctement décris

* Encodage caractères

ASCII

* Format renseigner
* Metadonnées

DC.TITLE="Le réveil de la force"

DC.TITLE LANG="FR"=STAR WARS 7. Le réveil de la force"

DC.CREATEUR="J.J.ABRAMS"

DC.CONTRIBUTOR="J.J.ABRAM"

DC.SUBJECT="

DC.DESCRIPTION="

DC.PUBLISHER="


(vieille documentaire: Aaron Swartz = voir le documentaire)

icone orange flux rss format xml

copier l'url dans notre application, truc pour vieille

si l'article nous plait, on peut twitter l'info.


10 sources d'informations:

-Le Monde

-AFP

-Wikilinks

- Danstapub

- canalplus.fr/c-emissions/c-le-petit-journal/pid6515-le-petit-journal.html

- allocine.fr

- http://jai-un-pote-dans-la.com/

- https://www.inamediapro.com/

- http://www.e-marketing.fr/

- http://www.ladn.eu/

- http://www.20minutes.fr/

- http://www.be-street.com/


Feedly: Charlène Rnjt

Diigo: Charlenernjt


* Interopérable

qu’on puisse le lire sur les iPad et les Kindle (sur différentes plateformes) c’est la capacité que deux machines ont de communiquer entre elles (généralement machine de contenu et machine productrice de service). Elles communiquent de façon structurée afin de produire un service, par exemple via des rétroliens Flux RSS, veille, détecter les évolutions de notre environnement pour anticiper les nouvelles choses.

Mon Projet

Le concept