English ENCOW14 web corpus now available first release version #ENCOW14A #corpuslinguistics

Through the corpora list
::::::::::::::::::::::::::::::::::

The English ENCOW14 web corpus is now available in its first release version ENCOW14A (16.8 GT full corpus, 9.6 GT shuffled). The shuffle version is completely free but available only to people working in the academia.

At the same time, we make available our new Colibri² web application hosted at webcorpora.org. It allows registered users to query the corpora or download the whole data sets. Colibri² also serves DECOW12AX
(German, 8.3 GT), NLCOW14AX (Dutch, 4.7 GT), SVCOW14AX (Swedish, 4.8 GT).

ENCOW14A was crawled in 2012 and 2014 in over 20 top-level domains, has undergone state-of-the-art deduplication, boilerplate removal, hyphenation repair and repair for run-together sentences (texrex). It is
annotated with POS (Penn/TreeTagger), lemma (TreeTagger), chunks (TreeTagger), as well as dependency relations (MaltParser, experimental). It contains the following meta data: URL, Last-Modified date, crawl date, country and city geolocation, and document quality score as well as paragraph boilerplate scores.

Download & web access via Colibri² (free registration required):
https://webcorpora.org/

Corpus information:
http://corporafromtheweb.org/encow14/

COW is created at Freie Universität Berlin, German Grammar Group:
http://hpsg.fu-berlin.de/

All processing specific to web documents was done with texrex:
http://texrex.sourceforge.net/

ENCOW14 includes GeoLite data created by MaxMind, available from:
http://www.maxmind.com.

:::::::::::

Roland Schäfer (ENCOW14/COW), Felix Bildhauer (COW)

Problemas sin solución, el sistema educativo y la cultura científica española

3006848456

Sam Ladner, Qualitative research step by step, FLICKR

Sostiene Neil deGrasse en una entrevista para El Mundo el pasado 28 de diciembre, no es broma, que en la cultura norteamericana “ir a por un problema sin solución y trabajar en él aunque no lo consigas es algo normal”. Lo dijo como respuesta ante la pregunta del periodista, Luis Quevedo, sobre la diferencia entre los éxitos en ciencia obtenidos por la cultura anglosajona y los obtenidos en nuestro país.

Salvando las diferencias obvias entre el tamaño, el producto interior bruto y, entre otras, las inversiones en ciencia en EEUU y España, deGrasse parece apuntar que el factor “cultural” es determinante. Desde el campo de las humanidades, y asumiendo que también se hace ciencia aquí, esto es, se produce conocimiento en este ámbito, acepto la premisa que plantea el astrofísico norteamericano. El planteamiento de problemas sin solución precisa de dos condiciones: por un lado un conocimiento exhaustivo del campo en cuestión, de sus fundamentos, de sus métodos y, por lo tanto, de su SOTA; por otro, la capacidad para aislar y problematizar el objeto de la inquisición intelectual dentro del campo científico en cuestión.

La práctica de la primera premisa ha sido y es el objeto del sistema educativo español en todos sus niveles, desde segundo ciclo de primaria a la enseñanza universitaria donde, desde una óptica puramente metodológica, se ha perseguido el aprendizaje memorístico, el conocimiento declarativo y, en mucha menor medida, el desempeño competencial y el conocimiento procedimental. Los que tenemos hijos en secundaria y primaria sabemos el peso del aprendizaje memorístico en la enseñanza actual. En este contexto, parece atinado pensar que el sistema no favorece las condiciones que posibiliten un clima en el que plantear retos intelectuales a los estudiantes, posiblemente debido a que carezcamos de las metodologías de evaluación adecuadas. Es obvio, por otra parte, que la evaluación del conocimiento declarativo se ha venido realizando durante décadas sin aparentes disfunciones, más allá de la discrecionalidad del profesor/evaluador al seleccionar las preguntas. El paso de un modelo puramente memorístico/declarativo a uno más procedimental y estimulante requiere un “reseteo” del sistema educativo, un replanteamiento de su metodología de trabajo y, más importante aún, de sus objetivos.

Edward Wilson en su libro Cartas a un joven científico, ED. Debate, escribe lo siguiente: “La investigación exitosa no depende de la habilidad matemática, ni siquiera de una comprensión profunda de la teoría. Depende en gran medida de elegir un problema importante y de encontrar una manera de resolverlo, aunque al principio sea de forma imperfecta. Con mucha frecuencia, la ambición y el espíritu emprendedor, combinados, vencen a la genialidad” (.p.236). Este es sin duda el factor cultural al que se refiere deGrasse y que tan necesario es desarrollar y promover en nuestro sistema educativo.

CFP | KESA 2015 | April 19 – 24, 2015 – Barcelona Submission deadline November 24, 2015

CFP | KESA 2015 | April 19 – 24, 2015 – Barcelona, Spain
KESA 2015, The International Workshop on Knowledge Extraction and Semantic Annotation

Through LinkedIn Corpus linguistics Group

Please consider to contribute to and/or forward to the appropriate
groups the following opportunity to submit and publish original
scientific results to KESA 2015.
The submission deadline is November 24, 2014.
Authors of selected papers will be invited to submit extended article
versions to one of the IARIA Journals: http://www.iariajournals.org

============== KESA 2015 | Call for Contributions ===============

CALL FOR PAPERS, TUTORIALS, PANELS

KESA 2015, The International Workshop on Knowledge Extraction and Semantic Annotation
April 19 – 24, 2015 – Barcelona, Spain

General/submission page: http://www.iaria.org/conferences2015/KESA.html

Contribution types;
regular papers [in the proceedings, digital library]
short papers (work in progress) [in the proceedings, digital library]
ideas: two pages [in the proceedings, digital library]
extended abstracts: two pages [in the proceedings, digital library]
posters: two pages [in the proceedings, digital library]
posters: slide only [slide-deck posted on www.iaria.org]
presentations: slide only [slide-deck posted on www.iaria.org]
demos: two pages [posted on www.iaria.org]
doctoral forum submissions: [in the proceedings, digital library]

Submission deadline: November 24, 2015

Sponsored by IARIA, www.iaria.org

Extended versions of selected papers will be published in IARIA
Journals: http://www.iariajournals.org

Print proceedings will be available via Curran Associates, Inc.:
http://www.proceedings.com/9769.html

Articles will be archived in the free access ThinkMind Digital Library:
http://www.thinkmind.org

The topics suggested by the conference can be discussed in term of
concepts, state of the art, research, standards, implementations,
running experiments, applications, and industrial case studies. Authors
are invited to submit complete unpublished papers, which are not under
review in any other conference or journal in the following, but not
limited to, topic areas.

All tracks are open to both research and industry contributions.

Before submission, please check and comply with the editorial rules:
http://www.iaria.org/editorialrules.html

KESA 2015 Topics (topics and submission details: see on the site)

Shallow knowledge extraction from large collections
Knowledge and ontology management
Knowledge acquisition from unstructured data
Concepts and standards for semantic annotation
Ontology learning
Semantic knowledge
Mining for topic annotation
Context and semantic annotation
User-centric semantic annotation
Semantic retrieval and annotation
Linguistic Linked Open Data
Methods in text and data mining
Interactive image searching
—————————-

KESA 2015 Co-Chairs
Maria Pia di Buono, University of Salerno, Italy
Mario Monteleone, University of Salerno, Italy
Annibale Elia, University of Salerno, Italy
===============================================