GitHub / techiaith 6 projects

Uned Technolegau Iaith / Language Technologies Unit

Uned ymchwil hunan-gynhaliol sy’n datblygu technolegau ar gyfer y Gymraeg / A self-funded research unit that develops technologies for the Welsh language

http://techiaith.bangor.ac.uk

Projects

Updated 9 months ago

brawddegau-tagiedig • Science 62%

Corpws o frawddegau CC0 mewn fformat jsonl, gyda rhannau ymadrodd y tocynnau (geiriau etc.) wedi'u tagio â thagiau Universal Dependencies. // A Corpus of CC0 sentences in the jsonl format, tagged with Universal Dependency part-of-speech tags.

Updated 9 months ago

anonymeiddiwr-beta • Science 52%

Anonymeiddiwr Beta ar gyfer testunau dwyieithog Saesneg-Cymraeg a thestunau Cymraeg uniaith.

Updated 9 months ago

spacy • Science 52%

Mae spaCy yn llyfrgell ar gyfer Prosesu Iaith Naturiol uwch yn Python a Cython. // spaCy is a library for advanced Natural Language Processing in Python and Cython.

Updated 9 months ago

lecsicon-cymraeg-bangor • Science 75%

Lecsicon cynhwysfawr o eirffurfiau'r Gymraeg yn seiliedig ar ddata gwirydd sillafu a gramadeg Cysill // A comprehensive lexicon of Welsh-language wordforms based on data from the Cysill spelling and grammar checker

Updated 9 months ago

corpws-meincnodi-rhannau-ymadrodd • Science 65%

Corpws ar gyfer meincnodi tagwyr rhannau ymadrodd Cymraeg | A corpus for benchmarking Welsh part-of-speech taggers

Updated 9 months ago

corpws-cc0 • Science 62%

Corpws o frawddegau o destun Cymraeg wedi'u trwyddedu o dan drwydded CC0 | A corpus of Welsh texts licensed under the CC0 licence