Projet Pro Lucie : Différence entre versions
(→Suivi de projet- Marin DACOS- notes du cours) |
(→=) |
||
| Ligne 61 : | Ligne 61 : | ||
Jeudi 14 janvier | Jeudi 14 janvier | ||
| − | Multicouches : Toutes les autres couches informationnelles en dehors du texte sont des métadonnées : métadonnées bibliographiques; annotations du lecteur (mots clé, résumé, --> DIIGO); annotations par commentaires publics, rétrolien; annotations automatiques (textmining); page rank : mesure la notoriété entre 0 et 10, en fonction des liens recherchés vers les pages. <br> | + | 4-Multicouches : Toutes les autres couches informationnelles en dehors du texte sont des métadonnées : métadonnées bibliographiques; annotations du lecteur (mots clé, résumé, --> DIIGO); annotations par commentaires publics, rétrolien; annotations automatiques (textmining); page rank : mesure la notoriété entre 0 et 10, en fonction des liens recherchés vers les pages. <br> |
| − | Principes du Page Rank : | + | Principes du '''Page Rank''' : mesure aussi le nombre de clics, principe rétro-lien, vitesse, nombre de clics et donc fréquentation des sites web. |
| + | Algorithme '''PANDA''' de Google : repère les fermes de contenus (pirates de contenus); détectent les "Duplicate contents" et les sanctionne (en lui donnant un Page Rank de 0, apparaît donc tout au fond des pages de résultats) <br> | ||
| + | '''PINGOUIN''' : même principe que PANDA mais pour les liens (SEO : Search Enging Organisation ??) : sites de ferme de liens sont condamnés par google | ||
| + | Donc l'ensemble des contenus vers d'autres sites peut avoir un impact sur notre page. <br> | ||
| + | Mobile friendly (facile à consulter sur un téléphone ou une tablette) | ||
| + | Le texte est seulement un petit morceau des couches informationnelles qui qualifient le texte (sa confiance, sa notoriété, sa visibilité, etc.) | ||
| + | |||
| + | 5- Hypertextualité du texte : | ||
Version du 14 janvier 2016 à 11:00
Sommaire
Idée du projet
Mon projet professionnel va s'orienter vers la communication de festival et plus précisément sur celle du festival Les Sucs en Scène. C'est un événement musical qui proposera sa troisième édition en 2016.
Contexte du festival
Ce festival est organisé par l'association Des Pieds Des Mains. C'est une groupe d'amis habitant en Haute-Loire pour la plupart, qui est à l'origine de cet événement.
Etant également altiligérienne, je connais certains de ses membres et j'ai aussi pu assister aux deux premières éditions.
Suivi de projet- Marin DACOS- notes du cours
Initiation à l'édition électronique
économie de la rareté ; économie de l'attention
Différents modèles développés par OpenEdition : modèle freemium (le plus connu : dropbox), skype était un modèle freemium (ex du New-York Times-B2C)
Coûts de transaction dans le numérique
Création de services aux professionnels pour usages intensifs, gratuit (exemple Bibliothèques universitaires - B2B). Fichiers PDF et EPUB
Bien non rival : quand on les donne on ne s'en dépossède pas (ex: la connaissances); Bien rival : quand on le donne on s'en dépossède (un stylo)
Histoire de l'édition électronique :
Wikipedia : modèle le plus achevé de l'édition électronique
1971 : projet Gutenberg : partage à travers des caractères majuscules (encodés ASCII avec 255 caractères disponibles), de la déclaration d'indépendance des Etats-unis.
1949 : Père Roberto BUSA (ecclésiastique italien) étudie les écrits sacrés et réalise un index : Index Thomisticus avec l'aide d'IBM, 56 volumes édités, les données existent toujours
Histoire de l'édition électronique se décompose en 3 temps :
1) La numérisation : GALLICA ; Google Books ; data mining (fouille de données) : explorer des données pour extraire une info supplémentaire ;
Text mining (fouille de texte) : pour décréter la langue d'un texte et sortir du texte de livres (texte qui doit être numérisé au départ). Le plus connu : Google Ngram : fonctionnement :
ROC (reconnaissance optique de caractères)
Sites de numérisation : Persee.fr et Jstor.org
2) Edition nativement numérique : On entre dans une édition multisupports. Utilise des fichiers numériques dès le début (PAO), date du milieu des années 80 (1984 avec apparition Mac), "What You See Is What You Get", encodage sémantique.
WYSIWYG : on voit graphiquement ce qu'on va obtenir. Gros défaut : on ne maîtrise pas le code qu'il y a derrière (il y a des données cachées).
Dominique Roux : Multi-supports pose problème car on a une rupture de charge dans le Workflow du livre (circuit de traitement), des différentes formes qui interviennent dans le support.
Rupture de charge : logistique = transport ; on doit transporter la charge sur un autre véhicule (entraîne des coûts supérieurs)
Metadonnées : données sur les données, ex sur un livre : auteur, poids, prix, etc. Dublin Core
FDCTT (faire et défaire c'est toujours travailler)
SSP (single source publishing) : système d'information qui est pensé par un architecte des systèmes d'informations (pas de système de charge), s'appuie sur une seule source, on entre dans un modèle avec un format pivot (XML).
Une seule source qui est la matrice de tous les autres formats. En SSP on essaye d'éviter toute rupture de charge.
Format PAO : centré sur l'apparence, la forme finale
3) L'édition nativement en réseau/en ligne : c'est le troisième âge de l'édition électronique (ex :Wikipedia). S'appuie sur le nombre d'utilisateurs et de producteurs, elle est commentable.
Rétrolien : lie deux articles grâce au Ping (équivalent du Poke sur Facebook), lorsqu'un article est cité dans un autre, on retrouve le Ping qui permet de retrouver les deux articles (l'un via l'autre).
Infobox : synthèse structurée sur une page Wikipedia.
Guerre d'édition
L'édition numérique, c'est (propriétés intrinsèques) :
Caractéristiques du texte numérique :
- mobile
- multiformat/ multisupport
- économie de l'attention
- modifiable
- commentable
- bien non rival
- collaboratif
- "ouvert à tous" différent du deep web (face invisible d'internet)
- interactif
- proche = indépendant de la distance
- dématérialisé (quasiment immatériel) - DATA CENTER : salles qui contient des centaines de milliers de serveurs -
- multicouche
- reproductible
- circule avec une grande fluidité, peut se doter de couches successibles
mail : marin.dacos@openedition.org (envoyer compte wikipédia (nom de l'utilisateur) qu'on aura créé, et modifs qu'on a réalisées : fautes corrigées, ajout d'informations, etc. sur au moins 4 caractères)
=================================
Jeudi 14 janvier
4-Multicouches : Toutes les autres couches informationnelles en dehors du texte sont des métadonnées : métadonnées bibliographiques; annotations du lecteur (mots clé, résumé, --> DIIGO); annotations par commentaires publics, rétrolien; annotations automatiques (textmining); page rank : mesure la notoriété entre 0 et 10, en fonction des liens recherchés vers les pages.
Principes du Page Rank : mesure aussi le nombre de clics, principe rétro-lien, vitesse, nombre de clics et donc fréquentation des sites web.
Algorithme PANDA de Google : repère les fermes de contenus (pirates de contenus); détectent les "Duplicate contents" et les sanctionne (en lui donnant un Page Rank de 0, apparaît donc tout au fond des pages de résultats)
PINGOUIN : même principe que PANDA mais pour les liens (SEO : Search Enging Organisation ??) : sites de ferme de liens sont condamnés par google
Donc l'ensemble des contenus vers d'autres sites peut avoir un impact sur notre page.
Mobile friendly (facile à consulter sur un téléphone ou une tablette)
Le texte est seulement un petit morceau des couches informationnelles qui qualifient le texte (sa confiance, sa notoriété, sa visibilité, etc.)
5- Hypertextualité du texte :