Utilisateur:MarionGrabowski

De Learning Lab Environnements Connectés
Sauter à la navigation Sauter à la recherche
Autoportrait M1.jpg

Qui suis-je ?

Jeune étudiante de 21 ans en Master Information Communication et Numérique à l'IRAM, originaire de Lyon, et passionnée par le milieu artistique, j'espère me diriger vers une carrière dans l'industrie de la mode. Étant plutôt sérieuse et originale dans mon genre, je pense avoir mes chances.

Cursus

Ma formation

  • Bac S-SVT à Lyon (promotion 2012)
  • Licence Arts Plastiques à Jean Monnet Saint Étienne (promotion 2015)
  • Master Info Comm et Numérique à l'IRAM

Mes expériences

Mes travaux

Mes points forts

  • Déterminée
  • Capable de sortir des expressions totalement inattendues
  • Motivée
  • Dynamique
  • Un sens de l'humour inimitable

J'aime


L'open édition - Marin Dacos

  • Économie de la rareté : construit le modèle économique de l'édition, le bien est rare et il y a donc plusieurs personnes en concurrence pour le posséder. C'est sur ce modèle que la presse s'est construite, en vendant des tirages. Dans le modèle du numérique on ne se dépossède pas des biens, on envoie des copies. Ce qui devient rare n'est pas le bien en lui-même. On parle de bien rival quand on le perd, et de bien non rival quand on partage une connaissance et qu'on ne la perd pas.
  • Économie de l'attention : difficile d'attirer l'attention du public, du lecteur tellement il y a des livres sur internet. Si on ne prend pas en compte ces changements il est compliqué de suivre le mouvement.

La presse doit inventer de nouveaux modèles économiques pour s'en sortir. Exemple de Mediapart qui arrive à s'en sortir.

Modèles économiques hybrides (mix entre les deux), abonnements pour une partie des contenus et autre partie libre d'accès. Mais les revues numériques sont insuffisants pour faire vivre une entreprise.

Il existe d'autres modèles développés par le NY Times par exemple comme le modèle "Freemium" (expérience complète du service et si on veut plus on paye) exemple : dropbox, on a toutes les fonctionnalités du logiciel et entre 5 et 8% des utilisateurs vont passer en Premium ensuite. Skype était un produit Freemium avant d'être racheté par Microsoft. Si on voulait faire des visio à plus que 2 il fallait avoir un compte Premium
Pay to win : si on ne paye rien on ne peut pas gagner

NY Times compte le nombre d'article lu dans le mois grâce aux cookies et au 10e article l'utilisateur est averti qu'il n'a pas accès au texte intégral du journal, il ne verra que le début et devra payer s'il veut continuer à voir plus. D'un point de vue technique, on peut facilement passer au dessus de cette limite en allant sur une autre session, un autre ordinateur ou en vidant le cache du navigateur. Cout de transaction c'est le temps que je passe à faire une transaction avec quelqu'un

  • B2C : Business to Consumers
  • B2B : Business to business, considérer que l'usage intensif va être un usage très professionnel, on va créer et vendre des services, et non pas vendre des contenus (qui seront gratuits, le HTML sera gratuit). En numérique, les chercheurs voudront le livre et le format numérique sur leur disque dur, des fichiers qui leur rappellent le livre papier. Ce qui sera vendu c'est donc les fichiers PDF et EPub (format iPad)

Edition électronique

Wikipédia, modèle le plus achevé, le plus radical de l'édition électronique (autour des années 2000) 1971, le projet Gutenberg, la déclaration d'indépendance des USA est tapée et partagée. Dans la version la plus avancée de l'ASCII il y avait 255 caractères disponibles 1949, le Père Roberto Busa s'allie avec une société de machines à écrire, il étudie les écrits sacrés. Fondateur d'IBM.

Se décompose en trois temps :

  • De la numérisation (ex : google books) Data Mining pour traiter les données, on va les explorer, de les extraire (fouille de données), et la fouille de texte va donc servir à sortir des informations du texte (ex : google) Google ngram, ROC (reconnaissance optique de caractère)
  • Édition nativement numérique (WYSIWYG, What You See Is What You Get, on ne maitrise pas le code qu'il y a derrière

le livre papier comme projection de livre machine, aujourd'hui une grande partie des efforts de l'édition numérique consiste à adapter ces livres papiers en livres machines, c'est à dire à les projeter de la dimension vers une dimension supérieure. projection de livre machines sous forme de livres papiers Si le livre avait été inventé après l'ordinateur, il aurait constitué une avancée majeure. Ses qualités sont remarquables : légèreté, disponibilité, faible coût, fonctionnement sans consommation d'énergie, qualité d'affichage. De plus, le livre constitue une interface particulièrement bien adaptée à l'homme. Le cerveau de ce dernier possède donc en effet une excellente mémoire spatiale, qui lui permet de localiser approximativement une information ou une page après lecture.

Métadonnées, ce sont des données sur une donnée, donc sur un livre c'est le titre, l'auteur, le résumé, le poids, le cout... On a besoin de les diffuser à un certain nombre de partenaires, on a besoin de produire plusieurs formats différents, et on veut aussi l'archiver pour le consulter dans les années à venir.
FDCTT (Faire et défaire c'est toujours travailler), travail manuel répétitif sans valeur ajoutée, on va tout modifier un par un dans tout les champ d'action du livre, papier ou numérique SSP (single source publishing) système que l'on peut appeler système d'information où tout est relié sans rupture de charge. Format pivot capable de produire n format différents, print ou numérique et un changement est propagé dans tout les supports. Une seule source qui permet de tout modifier, et on quitte le FDCTT. Formats centrés sur l'apparence, la forme finale. Je connais le fond, qui est au début, au pivot et ensuite je vais avoir plein de formes (dans un second temps, pour ne pas confondre la structure du document avec son apparence)

Auteur -> Édition -> Diffusion

  • Édition nativement en ligne (ex : Wikipédia, tout est conservé), on abolit pas les 2 premiers âges, ils cohabitent ensemble

rétrolien, on peut faire des commentaires et citer des textes d’autres blogs. le système envoie des PING pour informer que l’on cite quelqu’un. Au lieu d’avoir tout le texte du commentaire, il y aura juste un lien vers le commentaire (inventé pour les blogs et se diffuse de plus en plus) En gros un blog A fait un article, un blog B en fait un en citant l’article de blog A, ce qui va envoyer un ping au blog A « attention on te cite dans tel article » et donc l’article du blog B va être cité en commentaire sur le blog A avec un retrolien
Infobox, c’est une synthèse structurée. Wikipédia, déclenche des guerres d’édition où chacun essaye de convaincre, donc va se mettre en place des systèmes d’arbitrages neutres, de régulations collectives.


Édition numérique

  • multiformat, multisupport
  • modifiable
  • bien non rival (Texte numérique est reproductible quasiment sans coût spécifique, il a y quand même des coûts de matériel)
  • commentable
  • collaboratif
  • « ouvert à tous » (différent de deep web c’est la face invisible d’internet)
  • interactif
  • proche = indépendant de la distance
  • quasiment dématérialisé (on a besoin de la machine) (Data center, salles avec des serveurs, qui demandent beaucoup beaucoup d’énergie
  • Circule avec une grande fluidité, il peut se doter de couches successives)

Multicouche

Certains nombre de couches d’informations et les couches sont vivantes (on peut parler de vie documentaire, le document n’est pas figé une fois pour toute). On a la base de l’information, par exemple le texte, et toutes les couches sont des métadonnées métadonnées bibliographiques : titre, date de parution, épaisseur du livre…

  • Annotations lecteurs (mot clés, résumé..)
  • Annotations (commentaires, rétroliens…)
  • Annonations auto (text mining, va produire du sens…)
  • PageRank mesure la notoriété entre 0 (la plus basse) et 10 (la plus haute) d’une page, c’est une des clés d’attribution la plus importante parmi les critères. Important pour sa visibilité dans les moteurs de recherches. Google ajoute cette information en fonction des liens et des rétroliens vers le site / vitesse / fréquentation

Algorithme Panda de Google pour contrer les fermes de contenus (qui regroupent des copies de contenus déjà présents sur le web, c’est du piratage et ça reste illégal). Quand on va faire une recherche Google, on va tomber sur des « faux » sites avec le même contenu que les vrais, et ils apparaîtront dans les recherches Google. Algorithme Pinguin c’est la même chose mais pour les liens

Hypertextualité

Permet de lier deux pages entre elles, de naviguer de l’une à l’autre. Dans les écritures web, on recommande toujours d’écrire de l’hypertexte. C’est l’une des forces de Wikipédia, ces liens sont fait par des humains ou des robots, pour renvoyer par exemple vers un autre article.

Le texte numérique est indexable, réalisé par des tiers et obéissant à des logiques différentes. Il relève de l’économie de l’attention et non pas de celle de la rareté.


Le texte électronique idéal :

1/ Lisible
a. Format ouvert, c’est un format dont les spécifications techniques sont connues permettant à tout le monde de lire le format sans passer par les logiciels (codé en Wiki (pivot), interprété et rendu en HTML, Reverse Engineering, PDF, RTF, DOCX, XML, TXT, EPUB, JPG) DRM, Digital Right Management, c’est crypter le fichier, le rendre illisible, c’est un verrou numérique qui se débloque qu’à une seule condition, c’est que le système que l’on a ait le droit de lire ce document, afin qu’on ne puisse pas le lire sur le matériel des concurrents. Watermarking, n’altère pas la lisibilité du document
b. Recomposable, accessible, depuis 2005 tout les sites doivent être accessibles, il faut que les personnes aveugles puissent « lire » les sites web. W3C définit les grandes normes du web. Accessible aux personnes handicapées.
c. Conservable (le format DRM n’est pas conservable) exemple de 1984 d’Orwell qui a vendu ce livre sans en avoir le droit et a donc supprimé les bouquins sur les Kindle grâce au DRM


2/ Manipulable
a. Indexable et cherchable pour pouvoir faire du textmining dessus (robots.txt c’est un fichier que l’on met à la racine du serveur pour dire au moteur de recherche quel contenu il a le droit de lire ou non, pour plusieurs raisons : les sites qui font du moissonnage agressif qui va faire 100 requêtes tout les dixièmes de secondes, vont donc être blacklisté.) TDM (Text & Data Mining), selon la loi numérique, un site possède tout ses contenus et pour les réutiliser il faudra un contrat qui donne une session de droits d’exploitation de ces contenus (protégés par le droit d’auteur) mais depuis presque 20 ans google indexe les pages sans contrat Tout ce qui est deep web et dark web n’est pas indexable ou cherchable
b. Copiable et collable, c’est la base. Certains PDF ne peuvent pas se faire copier coller, javascript pour empêcher le clic droit et le copier coller (par exemple dans des livres en streaming) Licence Creative Commons, licence permettant de faire plusieurs actions et de réutiliser les contenus, le droit d’auteur existe pendant la création, il nous protège (droit d’auteur moral et patrimonial, droit incessible et éternel), il rend obligatoire la reconnaissance de la paternité de l’oeuvre. Il doit y avoir une mention du support (livre papier internet…). Coût de transaction : effort de retrouver l’auteur pour lui demander l’autorisation de l’utilisation de sa propriété intellectuelle et signer un contrat
Licence CC : déclaration unilatérale que l’on cède les droits, ce n’est pas un contrat, c’est dans le but d’éviter le contrat, il n’y a pas deux personnes qui interviennent mais juste une qui déclare que tout le monde est libre d’utiliser le contenu
CC BY : attribution de la paternité
CC BY NC : non commerciale, on interdit les utilisations commerciales sans contrat
CC BY ND : none dérivatif
CC BY NC SA : share alike, on autorise la modification a condition que le contenu soit diffusé selon la même licence
c. Annotable et inscriptible


3/ Citable
a. Identifiable : par l’URL, grosse base de données à deux colonnes : d’une part le nom du site et de l’autre l’adresse IP du serveur correspondant au site. Les paquets de données que l’on envoie transitent par les meilleurs chemins possibles avec des intermédiaires (ce chemin s’appelle un trace route) http://yahoo.fr a lire de droite a gauche, le « fr » c’est le TLD et ça veut dire que c’est lui qui autorise yahoo à s’appeler comme ça, yahoo c’est le nom de domaine et ce qui est avant (à gauche de yahoo) c’est le sous domaine .com correspond à l’ICANN, comme .org et pour avoir un nom de domaine on achète à hauteur de 12$ par an
b. Correctement décrits, c’est-à-dire lui donner une forme et des métadonnées qui sont interprétables
1. encodage de caractères, code ASCII en lien avec le projet Gutenberg, par exemple on va écrire 65 pour mettre un A, le 0 se code en 48. En tout il y avait 255 caractères. Ensuite est apparu la difficulté d’encoder des caractères spéciaux comme le chinois ou le japonais où le nombre de caractères est supérieur à 255. Codage UNICODE, le texte doit donc être correctement encodé.
2. format correctement décrit, donc idéalement ouvert, le renseigner correctement
3. métadonnées
c. Interopéable : qu’on puisse le lire sur les iPad et les Kindle (sur différentes plateformes)
c’est la capacité que deux machines ont de communiquer entre elles (généralement machine de contenu et machine productrice de service). Elles communiquent de façon structurée afin de produire un service, par exemple via des rétroliens Flux RSS, veille, détecter les évolutions de notre environnement pour anticiper les nouvelles choses

Insertion Pro

Édition électronique - Marion