Building and Exploring Web Corpora (WAC3 - 2007)

Proceedings of the 3rd web as corpus workshop, incorporating cleaneval
Première édition

WACMore and more people are using Web data for linguistic and NLP research. The Web as Corpusworkshop (WAC) provides a venue for exploring how we can use it effectively and the advancementsto which this could lead.This book is a collection of... Lire la suite

WAC

More and more people are using Web data for linguistic and NLP research. The Web as Corpusworkshop (WAC) provides a venue for exploring how we can use it effectively and the advancementsto which this could lead.This book is a collection of the talks presented at the 3 rd WAC in Louvain-la-Neuve (Belgium).The focus is on the description of Web corpus collection projects, the exploration of Web datacharacteristics from a linguistics/NLP perspective, and on the use of crawled Web data for NLPpurposes.

CLEANEVAL

Any use of Web data requires that it be cleaned in order to get rid of unwanted material including,for example, HTML markup, navigation bars, advertisements. To date there has been no sharingof resources or expertise in this particular domain and the cleaning has often been done minimally.Cleaneval was an exercise aimed at promoting collaboration and improving our understandingof the issues. Results and perspectives are presented in this book.


PDF (PDF) - En anglais 9,00 €
Livre broché - En anglais 19,70 €

InfoPour plus d'informations à propos de la TVA et d'autres moyens de paiement, consultez la rubrique "Paiement & TVA".
Info Les commandes en ligne se font via notre partenaire i6doc.

Spécifications


Éditeur
Presses universitaires de Louvain
Partie du titre
Numéro 4
Édité par
Cédrick Fairon, Hubert Naets, Adam Kilgarriff, Gilles-Maurice de Schryver,
Collection
Cahiers du CENTAL | n° 11
Langue
anglais
BISAC Subject Heading
LAN009000 LANGUAGE ARTS & DISCIPLINES / Linguistics
Code publique Onix
06 Professionnel et académique
CLIL (Version 2013-2019 )
3147 Linguistique, Sciences du langage
Date de première publication du titre
2007
Subject Scheme Identifier Code
Classification thématique Thema: Langage et linguistique
Type d'ouvrage
Monographie

Livre broché


Date de publication
13 novembre 2017
ISBN-13
978-2-87558-608-7
Ampleur
Nombre de pages de contenu principal : 236
Dépôt Légal
D/2017/9964/44 Louvain-la-Neuve, Belgique
Code interne
95733
Format
14,8 x 21 cm
Poids
20 grammes
Type de packaging
Aucun emballage extérieur
Prix
20,00 €
ONIX XML
Version 2.1, Version 3

Google Livres Aperçu


Publier un commentaire sur cet ouvrage

Si vous avez une question, utilisez plutôt notre formulaire de contact

Sommaire


LE MUSÉE ET SES COLLECTIONS
􀀭􀀦􀀴􀀁􀀤􀀰􀀭􀀭􀀦􀀤􀀵􀀪􀀰􀀯􀀴􀀁􀀶􀀯􀀪􀀷􀀦􀀳􀀴􀀪􀀵􀀢􀀪􀀳􀀦􀀴
􀀭􀀢􀀁􀀨􀂲􀀯􀂲􀀳􀀰􀀴􀀪􀀵􀂲􀀁􀀥􀀦􀀴􀀁􀀥􀀰􀀯􀀢􀀵􀀦􀀶􀀳􀀴
􀀭􀀦􀀁􀀣􀂬􀀵􀀪􀀮􀀦􀀯􀀵􀀁􀀥􀀈􀀢􀀯􀀥􀀳􀂲􀀁􀀫􀀢􀀤􀀲􀀮􀀢􀀪􀀯
L'EXPOSITION PERMANENTE
S'ÉTONNER
􀀭􀀈􀀪􀀯􀀤􀀳􀀰􀀺􀀢􀀣􀀭􀀦􀀁􀀥􀀪􀀷􀀦􀀳􀀴􀀪􀀵􀂲􀀁􀀥􀀶􀀁􀀮􀀰􀀯􀀥􀀦
SE QUESTIONNER
􀀭􀀢􀀁􀀱􀀢􀀴􀀴􀀪􀀰􀀯􀀁􀀥􀀦􀀴􀀁􀀤􀀩􀀦􀀳􀀤􀀩􀀦􀀶􀀳􀀴
􀀭􀀦􀀴􀀁􀀪􀀯􀀴􀀵􀀳􀀶􀀮􀀦􀀯􀀵􀀴􀀁􀀴􀀤􀀪􀀦􀀯􀀵􀀪􀀧􀀪􀀲􀀶􀀦􀀴􀀍􀀁􀀪􀀯􀀴􀀵􀀳􀀶􀀮􀀦􀀯􀀵􀀴􀀁􀀥􀀦􀀁􀀳􀀦􀀤􀀩􀀦􀀳􀀤􀀩􀀦
􀀭􀀈􀀰􀀳􀀪􀀨􀀪􀀯􀀦􀀁􀀥􀀦􀀴􀀁􀀦􀀴􀀱􀂵􀀤􀀦􀀴
􀂮􀀁􀀭􀀢􀀁􀀳􀀦􀀯􀀤􀀰􀀯􀀵􀀳􀀦􀀁􀀥􀀦􀀴􀀁􀀮􀂲􀀥􀀦􀀤􀀪􀀯􀀦􀀴􀀁􀀵􀀳􀀢􀀥􀀪􀀵􀀪􀀰􀀯􀀯􀀦􀀭􀀭􀀦􀀴
TRANSMETTRE
􀂲􀀤􀀳􀀪􀀳􀀦
􀀤􀀢􀀭􀀤􀀶􀀭􀀦􀀳
S’ÉMOUVOIR
􀀭􀀢􀀁􀀭􀀪􀀣􀀦􀀳􀀵􀂲􀀁􀀤􀀳􀂲􀀢􀀵􀀳􀀪􀀤􀀦􀀏􀀁􀀢􀀳􀀵􀀁􀀮􀀰􀀥􀀦􀀳􀀯􀀦
􀀭􀀢􀀁􀀮􀂲􀀥􀀪􀀵􀀦􀀳􀀳􀀢􀀯􀂲􀀦􀀍􀀁􀀣􀀢􀀴􀀴􀀪􀀯􀀁􀀥􀀈􀂲􀀤􀀩􀀢􀀯􀀨􀀦􀀴􀀁􀀤􀀶􀀭􀀵􀀶􀀳􀀦􀀭􀀴􀀏􀀁􀀢􀀯􀀵􀀪􀀲􀀶􀀪􀀵􀂲􀀁
􀀮􀀰􀀺􀀦􀀯􀀁􀂬􀀨􀀦􀀍􀀁􀀵􀀦􀀮􀀱􀀴􀀁􀀮􀀰􀀥􀀦􀀳􀀯􀀦􀀴
􀀭􀀢􀀁􀀨􀀳􀀢􀀷􀀶􀀳􀀦􀀁􀀦􀀵􀀁􀀴􀀦􀀴􀀁􀀵􀀦􀀤􀀩􀀯􀀪􀀲􀀶􀀦􀀴􀀏􀀁XVE – XXE􀀁􀀴􀀪􀂵􀀤􀀭􀀦
􀀱􀀪􀂲􀀵􀂲􀀁􀀦􀀵􀀁􀀢􀀳􀀵􀀁􀀱􀀰􀀱􀀶􀀭􀀢􀀪􀀳􀀦􀀁􀀦􀀯􀀁􀀦􀀶􀀳􀀰􀀱􀀦
􀀤􀀳􀀰􀀺􀀢􀀯􀀤􀀦􀀴􀀁􀀦􀀵􀀁􀀰􀀣􀀫􀀦􀀵􀀴􀀁􀀳􀀪􀀵􀀶􀀦􀀭􀀴􀀁􀀦􀀯􀀁􀀢􀀧􀀳􀀪􀀲􀀶􀀦
CONTEMPLER
􀀭􀀦􀀁􀀳􀀦􀀨􀀢􀀳􀀥􀀁􀀥􀀈􀀶􀀯􀀁􀀢􀀮􀀢􀀵􀀦􀀶􀀳􀀏􀀁􀀭􀀢􀀁􀀤􀀰􀀭􀀭􀀦􀀤􀀵􀀪􀀰􀀯􀀁􀀥􀀦􀀁􀀤􀀩􀀢􀀳􀀭􀀦􀀴􀀁􀀥􀀦􀀭􀀴􀀦􀀮􀀮􀀦􀀁
􀀭􀀦􀀁􀀤􀀰􀀳􀀱􀀴
LE VISAGE
LA BEAUTÉ DE LA SIMPLICITÉ
LE MUSÉE L +
L’ÉTUDE DES COLLECTIONS
L’ASSOCIATION DES AMIS DU MUSÉE L
􀀮􀂲􀀤􀂵􀀯􀀦􀀴􀀁􀀦􀀵􀀁􀀱􀀢􀀳􀀵􀀦􀀯􀀢􀀪􀀳􀀦􀀴