vendredi 15 novembre 2013

C'est la crise !!!!

Bonjour tout le monde !!!!

L'affaire est grave.
Il s'agit là d'une grosse remise en question concernant la base même de notre travail.









LA DÉFINITION DE NOTRE RECHERCHE

Le problème naquit sans aucun doute à cause du manque de définition propre de notre recherche, quelle est précisemment la question sous-jacente à tout notre projet, pourquoi donc ??

Nous nous sommes contentés de choisir une thématique plaisante, soit.
Pour rappel, la cuisine en Europe occidentale et orientale.

Pour autant, nous sommes bien incapables actuellement d'avancer un angle spécifique sur cette thématique pour motiver notre recherche. Nous n'avons pas tranché dans cette thématique pour la faire vivre le long d'un projet.
Nous avons choisi de nous laisser porter par notre recherche plutôt que de la diriger.
Ne soyons pas bêtes. Pour le coup, laissons-nous plutôt guider par notre thématique pour que se révèle à nous la grande question parente de notre projet.
Soit, très artificiellement, projetons-nous dans un problème créé de toutes pièces par nos cerveaux vicieux. Trouvons pour notre destinée la voie du succès.


LA RECHERCHE DES URLS

Quelle méthodologie clairement précisée avons-nous utilisé tous ensemble pour la recherche et la sélection de notre corpus ??
Aucune.

Nous avons tous les trois utilisé l'outil moteur de recherche, c'est bien tout.


Quel mot clé, quelle caractéristique linguistique a-t-on spécifié théoriquement puis utilisé pour taper dans le champ de recherche du moteur ??
Rien.

Nous sommes tout de même dans un travail de nature linguistique, traiter de problèmes d'encodage n'étant pas forcément le plus passionnant, attachons-nous donc à un certain marquage linguistique.


Dans ce cas quelle cohérence assurer à notre corpus ??
Aucune.

Il est important de préciser en sus que la cohérence de notre corpus doit en plus être interne c'est-à-dire pour une langue donnée puis aussi externe c'est-à-dire interlinguale. À cet égard, nous devons favoriser une communication de groupe efficace.


Il paraît bien important d'avoir un corpus proprement cadré pour la simple et bonne raison qu'il sera d'autant plus maniable à l'interprétation afin d'en dégager des terminaux ravageurs. Tenons-nous en donc aux faits !!


------

Pour conclure,  on doit se rendre compte qu'il n'est pas possible de mener une recherche d'URLs efficace étant motivée par... Rien. Les deux parties sus-traitées sont totalement imbriquées, ce qui montre au passage la belle harmonie de cet article.
Nous devons donc dès à présent répondre à cet appel du cœur, main dans la main nous retrousser les manches (pas forcément facile) et revoir notre copie. Ce n'est pas perdu, la remise en question est nécessaire, elle signifie déjà la prise de conscience de notre part.
Posons une question simple et claire en gardant notre thématique particulièrement sympathique au demeurant. Ne nous perdons pas dans des nébuleuses dorées. Le vrai changement c'est maintenant, nous tiendrons cet engagement dans les prochains articles.

mardi 12 novembre 2013

Petits problèmes de codage ???

 Hello !!


En parlant de page dumpée, vous est-il arrivé de cliquer sur la colonne concernée dans le tableau préparé pour l'exercice de création d'un tableau répertoire global de nos urls traité sur cette page ?

Eh bien moi oui , et voici ce que j'ai eu à l'écran :






Je vous passe la suite c'est du même ordre...

l'option file -i dit pourtant :

Ainsi le navigateur ne reconnait pas que la page dumpée est codée en utf-8.

"c'est bien beau tout ça mais comment je fais moi pour la lire ta page ???"

 Il reste juste à corriger cela avec les outils propres au navigateur (pour moi sur chrome : onglet paramètres→outils→codage→utf8)

Ce qui affiche :

Du beau japonais bien plus ..."lisible".

"ouf alors ce n'était que "ça" ?"

Oui et ... non , prenons maintenant un cas extrême afin de voir ce qui pourrait nous arriver dans la suite du projet.
Le cas dont je parle est présent sur :
http://www.let.osaka-u.ac.jp/~okajima/tokan.htm

(et nous le devons à Mr Perrot, on lui dira bien merci !!!)

voici ce qu'affiche la page en question :


si on "s'amuse" à faire un wget sur l'url et à scruter le fichier avec la loupe file -i on obtient :


on espère donc lire le codage dans l'entête du code html on fait donc un head du fichier ce qui donne le résultat navrant de :


Ici pas de solution ... sinon que notre propre connaissance en japonais nous permet de dire qu'il s'agit d'un codage japonais (shift-JIS, EUC-JP,...), ceci car le titre du fichier tokan ou 東関 évoque directement un nom japonais...

Faisons un petit test avec le shift-JIS à l'aide du navigateur comme tout à l'heure, et fort heureusement on obtient :


Nettement plus lisible ... (enfin tout est relatif)

Bonne soirée à tous !!!