Utilisateur:Ali Mouna
Sommaire
1)Qui suis je ?
MOUNA ALI Maidane
Nee le 20/07/1989 à Djibouti
Étudiante en master 1 INCONNU à L'IRAM de Saint Étienne
2)Cursus Universitaire
2015 - Master 1 Information communication numérique 2013 - Licence 3 Sciences et technique de l'information et de la communication (STIC) option Documentation 2012 - Licence 2 Journalisme,Communication et Documentation (JDC) 2011 - Licence 1 Journalisme,Communication et Documentation(JDC) 2010- STG spécialité (CGRH)
3)Expérience Professionnelle
01/3/2013– 25/09/2014
_stage dans le ministre de la communication de Djibouti
Rédaction des article de presse
01/10/2013– 25/08/2014
CDI Mairie de la ville de Djibouti. Communicante dans les affaires externe de la mairie
4)Vie personnelle
-Lire -cuisine -Sport
5)AUTRE
Cours Martin Dacos
Economie de la rareté : ex. du péage : mettre un ligne un journal payant : la presse en mettant en place un modèle essentiellement payant se saborde. Mediapart a construit son fonctionnement sur le paradigme de la rareté. Seul journal qui fonctionne sur ce système (notoriété très importante d'E. Plenel + sortent des "scoops" ) Economie de l'attention : attention du public, et celle-ci devient rare du fait du nombre très important de documents disponibles sur internet. La presse en général fonctionne sur un modèle hybride : accès ouvert à certaines informations + des textes qui restent payants. Modèle freemium : dans le cas de jeu, "free" = je peux gagner sans payer . "mium" : excellence ( différent du "pay to win" : si on ne paie pas, on ne gagnera pas !) Exemple pour Dropbox : offre une expérience complète mais non intense Système du New York Times : article en libre consultation , mise en place de cookies qui s'incrémentent et au bout de X articles consultés gratuitement, les articles sont proposés payants. Dans le numérique, dans une bataille pour l'attention, le cout de transaction est décisif : le temps que je passe pour faire une transaction avec qelqu'un. Logique B to C : business to consumers La cible de l'open editions est le B to B : business to business : on va considérer que l'usage intensif va être professionnel . Des services sont créés pour les professionnels . Ce sont les services qui sont vendus , pas directement les contenus = en HTML, ce sera gratuit. Ce qui est payant (= usage intensif): les pros, les chercheurs en SHS par ex. ont besoin d'avoir les fichiers sur leur disque dur. Ce sont les fichiers pdf, et les fichiers EPUB qui leur sont proposés à la vente par le biais d'abonnement ( pour télécharger un pdf, la bibliothèque doit prendre un abonnement afin que les chercheurs y aient accès)
les trois temps
L'édition numérique
Roberto Busa (1946) : Index Thomisticus - numérisation, données portées sur CD-rom Projet Gutemberg (1971) : livres tapés par des gens et mis à dispo de tous. Gallica : numérisation JPEG (BNF) GoogleBooks Fouille de texte - text mining (/data mining - big data). On extrait de nouvelles données à partir de données existantes (stats) - idem pour les textes. Google Ngram : stats à partir du corpus de GoogleBooks (OCR Optical Caracter Recognition - reconnaissance optique de caractère : on reconnait les caractères image) (attention, composition du corpus ?) Outiller le corpus <=> grandes possibilités (ex : Bilbo Open Edition) WYSIWYG (what you see is what you get) : encodage => PAO Roberto Busa (1946) : Index Thomisticus - numérisation, données portées sur CD-rom Projet Gutemberg (1971) : livres tapés par des gens et mis à dispo de tous. Gallica : numérisation JPEG (BNF) GoogleBooks Fouille de texte - text mining (/data mining - big data). On extrait de nouvelles données à partir de données existantes (stats) - idem pour les textes. Google Ngram : stats à partir du corpus de GoogleBooks (OCR Optical Caracter Recognition - reconnaissance optique de caractère : on reconnait les caractères image) (attention, composition du corpus ?) Outiller le corpus <=> grandes possibilités (ex : Bilbo Open Edition) WYSIWYG (what you see is what you get) : encodage => PAO
L'édition nativement numérique
SPP : single source publishing. On a une source (pivot), lorsqu'on la modifie, ça impacte tous les dérivés (formats PDF, e-pub, online...) On peut décrire une mise en forme pour chaque format (sur mon format 1, les titres sont toujours comme ceci. Au format 2, ils sont comme cela.) (même principe que HTML/CSS : ici, texte XML => tranformé XSLT) Grâce aux métadonnées, toute la chaîne est automatisée et on travaille seulement sur une source d'origine. L'édition nativement en ligne Exemple : Wikipedia commentable (site B cite le site A, le cite A reçoit un ping pour proposer de générer un commentaire sous son article avec un lien vers l'article du site B qui cite le sien (retrolien).) InfoBox Guerre d'édition ? (historique toujours accessible, transparence). Caractéristiques du texte numérique idéal : Multiformat, multiplateforme dématérialisé modifiable collaboratif commentable économie de l'attention, bien non rival interactif indépendant de la position, distance /!\ attention, penser à l'infrastructure nécessaire même pour du virtuel.
Le texte électronique idéal
3 grandes qualités Lisibilité Le texte, le livre, peu importe, tout doit être lisible. 1 - Format OuvertLe HTML est le plus ouvert des formats. Codé d'abord en Wiki, le code est interprété puis ressort en HTML. Le WYSIWYG est illisible, il cache le système. Un format ouvert est un format dont les spécificités techniques sont connues. Le REVERSE ENGINEERING : essaye de comprendre comment un fichier est conçu sans avoir accès à l'encodage. RTF DOCX XML TXT JPG EPUB DRM : Digital Rights Management -> le but est de crypter le fichier. Système de verrou numérique qui rend le livre par exemple illisible. Décryptage des DRM via des logiciels comme Adobe Digital Edition. Le logiciel contacte donc les fournisseurs pour voir si l'on a bien le droit d'acquérir ce contenu. Numilog : Société qui vend des livres chronodégradables, ce qui veut dire que par exemple au bout de 8 jours, le livre se supprime. Watermarking (tatouage numérique) : Pour éviter que le livre circule trop, il rajoute le nom de l'acheteur sur la couverture ou une page. C'est un système qui veut éviter la diffusion du livre. 2 - Recomposable Ce qui veut dire que le fichier s'adapte au terminal de lecture. Le PDF ne permet pas d'être recomposable car il est dédié à l'impression. Norme que tous les sites publics doivent respecter, ils doivent être accessibles depuis 2005. Normes établies par le W3C. Pour les images, la métadonnée à ajouter est la balise Alt. On peut naviguer sur les sites web accessibles via une touche par une touche. 3 - Conservable Aucun livre sous DRM n'est conservable. Affaire Bruce Willis / Canular Il a acheté une grande bibliothèque de musiques sur iTunes mais il s'est rendu compte qu'il ne peut pas en faire hériter ses enfants. Il porte plainte contre Apple. "Code is Law" -> Le code c'est la Loi. Le code s'impose à nous sans qu'on est le choix. Vient de M. Lessig. Manipulable[modifier] Indexable et cherchable[modifier] Par exemple Wikipédia ou LeMonde. Moteurs de recherche parcours le Web pour copier le contenu sur les serveurs pour faire du text-mining dessus. Robots.txt Fichier à la racine du serveur, dit au moteur de recherche à quel contenu il a le droit et à quel contenu il n'a pas le droit. Permet d'éviter le moissonnage agressif : attaque DDos en quelque sorte, X requêtes par minute. Permet également d'éviter les mauvaises pratiques comme empêcher un service concurrent d'indexer le site. Sitemap. Dit au robot où indexer pour lui donner accès à toutes les pages du site. Les livres protégés par les DRM par exemple ne sont pas indexables par les outils de recherche des ordinateurs. Copiable et collable[modifier] Un des éléments majeurs offert par le numérique. Mais certains sites n'autorisent pas le clic droit, ou encore C/C est difficile sur le format PDF. Le droit d'auteur protège l'oeuvre dès la première seconde de création, toute la durée de la vie, puis 70 ans après la mort. La protection morale : le fait qu'on reconnaissance la paternité de la création. Incessible. Le droit patrimonial : le droit d'exploitation de l'oeuvre. Cessible. Il y a différents niveaux de droit d'exploitation. Les Creative Comments permettent de déclarer à l'auteur de façon unilatéral qu'il cède des droits d'utilisation à qui veut et sans contrat. C'est une licence et non un contrat. CC = Creative Comments. BY = Annoncer l'auteur. NC = Non Commercial. ND = Non Derative = Refus de modifications. SA = Sharelike = Autorise les modifications seulement si la personne va produire un nouveau contenu sous la même licence. Annotable et inscriptible[modifier] Sur iBooks, il est par exemple possible d'annoter le fichier ePub. Citable[modifier] Pour être citable, un texte électronique doit être identifiable. Identifiable[modifier] Nécessité de donner un identifiant unique. Le plus courant est l'URL = l'adresse web. Le web s'appuie sur une structure qu'est le DNS = Domain Name System. C'est une grosse base de données à deux colonnes, à gauche le nom du site, à droite l'adresse IP. TRACEROUTE c'est la route de l'ordinateur jusqu'au serveur du site puis le retour via les DNS. Lecture d'une adresse URL : Il faut lire de droite à gauche. TLD = ".fr" -> géré par l'Etat Français. yahoo = domaine. m = mobile = sous-domaine. 301 Works = système d'archivage des réducteurs d'URL.
Correctement décrits Lui donner une forme et des métadonnées interprétables. 1 : Les caractères doivent être correctement encodés. de la force". Pour les dates, il est bien de déclarer la structure car il y a différentes façon d'écrire une date. DC.DATE SCHEME="W3CTDF"="2015-01-16". Le code ASCII : système rudimentaire qui existe depuis 40 ans. Il permet d'encoder les lettres en chiffres. Il est composé de 255 caractères. Cependant on s'est rapidement mis à traduire d'autres caractères tels que le cyrillique par exemple. Le problème étant que les caractères étaient encoder avec les même nombre que pour les caractères arabes. Donc il était impossible de communiquer entre différents types de langues. Nous avons donc inventé l'UNICODE. L'UNICODE : Il contient des centaines de millieurs de code qui permet une coordination mondiale. Il a unifier tous les codages du monde. Il y a donc maintenant un code unique pour un caractère unique. 2 : Format. Idéalement en format ouvert 3 : Les métadonnées. Le DUBLIN CORE : un système de métadonnées qui connait 15 balises pour renseigner un document. Exemple avec Star Wars 7 : DC.TITLE="Le réveil de la force". DC.TITLE LANG="FR"=". (DC qualifié) DC.TITLE LANG="FR"=STAR WARS 7". (DC qualifié) DC.TITLE LANG "FR"="Le réveil Format universel. Intéropérable[modifier] Le but est que le format marche peu importe la plateforme. Le format peut marcher sur un iPad ou une tablette Kindle par exemple. RSS : Really Simple Syndication. Agréger des flux pour être au courant des nouveautés. https://fr.wikipedia.org/wiki/Aaron_Swartz Le protocole le plus simple : OAI-PMH : OPEN ARCHE INITIATIVE PROTOCOL FOR METADATA HARVESTING. Protocole permet l'opérabilité entre l'entrepôt et moissonneur. Entrepôt = produit données. Moissonneur = collecte données. Pour structurer, on va utiliser les VERBES, ce sont les instructions. La première question est de demander qui est l'entrepôt par la question IDENTIFY. Les systèmes d'Information[modifier] C'est l'ensemble des informations qui manipulent l'entreprise, la structure de ces informations et leurs interactions. L'ensemble du SI c'est l'addition de tous les workflow et de toutes les informations. Dans toutes les structures il y a un grand système d'information. On intervient en permanence dans ces informations, quoi que l'on fasse. Les mauvaises pratiques Cliquez "ici" est une mauvaise pratique car en terme d'accessibilité la zone cliquable est trop petite. Google Bombing : liens sur des mots violents par rapport à un site. Faire un lien sur le mot "petit" pour le site sarkozy.fr