Aqueth còrpus qu’ei lo resultat d’ans de tribalh. Qu’amassa òbras de divèrs genres (roman, teatre, poesia, conte, premsa…) e qu’arcuelh la variacion grafica e dialectau. Los tèxtes que son encodats segon los formats estandards de constitucion e de difusion de còrpus (format XML, nòrma TEI P5).

L’accès ad aqueras dadas qu’ei essenciau entaus estudis lingüistics, per’mor que son necessàrias tà bastir un diccionari generau de la lenga occitana, tà las recèrcas en literatura, en sciéncias umanas, en didactica e tà l’ensenhament de la lenga.

La tòca de BaTelÒc n’ei pas de prepausar un còrpus de referéncia de l’occitan, mes de hornir aus utilizators un ensemble de tèxtes pro larg tà que cadun i posca seleccionar los qui’u permeteràn de hargar lo son còrpus de tribalh. Que prepausa ua interfàcia de consultacion dab un motor de recèrca.

Peu moment, la basa que contien 95 tèxtes (3,37 milions de mots) de 49 autors diferents. Que serà enriquida regularament.

Accedir tà BaTelÒc