Mae arbenigwyr iaith a data ym Mhrifysgol Caerdydd yn cydweithio i ddatblygu llwyfan dwyieithog ar-lein i ddadansoddi data holiaduron.

Byddan nhw hefyd yn cydweithio ag academyddion ym Mhrifysgol Lancaster, yr Ymddiriedolaeth Genedlaethol yng Nghymru a Cadw ar y prosiect FreeTxt | TestunRhydd i alluogi sefydliadau mawr i ymateb yn gyflym i farn cwsmeriaid Cymraeg a Saesneg eu hiaith.

Mae atebion ar ffurf sylwadau ychwanegol gan bobol sy’n llenwi holiaduron yn gallu bod yn her i ystod eang o gwmnïau a sefydliadau preifat a chyhoeddus nad oes ganddyn nhw mo’r sgiliau na’r arbenigedd i brosesu a dadansoddi’r sylwadau’n gyflym.

Her arall yw diffyg sgiliau iaith Gymraeg dadansoddwyr data, sy’n ei gwneud hi’n anodd iddyn nhw ddeall rhai atebion ysgrifenedig ychwanegol, yn enwedig os ydyn nhw’n gymysgedd o Gymraeg a Saesneg yn achos rhai o’r bobol sy’n ymateb ac sy’n llai hyderus eu Cymraeg.

Er bod teclynnau ar gael yn ddigidol i ddadansoddi data ar ffurf testun, yn enwedig ym meysydd academia, marchnata a chysylltiadau cyhoeddus, maen nhw’n ddrud a dydyn nhw ddim o reidrwydd wedi’u rhaglennu i brosesu sylwadau ychwanegol yn Gymraeg mewn holiaduron.

Bydd defnyddwyr yn gallu cofnodi data o holiaduron, a bydd y platfform wedyn yn gallu prosesu’r testun i gynnig delwedd sy’n hawdd ei dehongli o’r geiriau sy’n ymddangos yn fwyaf amlwg.

Bydd academyddion yn cydweithio’n agos â Cadw a’r Ymddiriedolaeth Genedlaethol yng Nghymru i ddylunio, adeiladu a phrofi’r teclyn er mwyn sicrhau ei fod yn addas at y pwrpas ac yn diwallu anghenion siaradwyr Cymraeg a Saesneg fel ei gilydd.

Cyfle cyfartal

“Yn ein diwylliant modern sydd wedi’i arwain gan gwsmeriaid, mae’r broses o gasglu ac ymateb i adborth yn treiddio i bob agwedd ar fywyd,” meddai Dr Dawn Knight o Brifysgol Caerdydd sy’n arwain ar y prosiect.

“Gall adborth o holiaduron, grwpiau ffocws a holiaduron gynnwys sylwadau ‘testun rhydd’ sy’n ieithyddol gyfoethog a all fod yn her yn aml iawn i brosesu a dadansoddi’n hawdd, o ganlyniad i nifer y sylwadau.

“Yn y prosiect hwn, rydym yn anelu i adeiladu teclyn ar-lein rhad ac am ddim, FreeTxt | TestunRhydd, a fydd ar gael i unrhyw un mewn unrhyw sector, i gefnogi dadansoddi nifer o ffurfiau ar ddata agored, testun rhydd yn Saesneg a Chymraeg.

“Bydd y platfform yn dadansoddi sylwadau niferus yn gyflym, gan dynnu allan themâu cyffredin, fel bod modd gweithredu ar adborth pwysig yn effeithlon.

“Gobeithiwn y bydd y prosiect hwn o gymorth arbennig i sefydliadau wrth iddyn nhw weithio er mwyn sicrhau bod y sawl y mae’n well ganddyn nhw gyfathrebu yn Gymraeg yn cael cyfle cyfartal i gynnig sylwadau ac adborth.”

Y prosiect yn adeiladu ar waith blaenorol

Mae’r prosiect hwn yn adeiladu ar waith blaenorol Dr Dawn Knight ar y Corpws Cenedlaethol Cymraeg Cyfoes (CorCenCC).

Mae hwn yn gasgliad o samplau ieithyddol o eirfa sydd wedi’u casglu drwy gyfathrebu â siaradwyr Cymraeg.

“Rydym yn edrych ymlaen at gydweithio â phrifysgolion Caerdydd a Lancaster ar y prosiect FreeTxt/TestunRhydd,” meddai Rebecca Williams, Cyfarwyddwr Cynorthwyol Ymgynghori gyda’r Ymddiriedolaeth Genedlaethol yng Nghymru.

“Does dim teclyn arall ar y farchnad sy’n ein galluogi ni i fesur sentiment yn Gymraeg, felly rydym yn gobeithio y bydd hyn yn ein galluogi ni i ddeall adborth ysgrifenedig yn fwy cywir, yn ogystal ag agor y drws i sefydliadau ddehongli a gweithredu ar sail data yn y Gymraeg.

“Mae adborth gan ein cefnogwyr yn helpu i lywio ein blaenoriaethau, rhaglennu, digwyddiadau a mwy, ac fe fydd cael teclyn yn ei le sy’n ein helpu ni i adnabod themâu allweddol yn ein galluogi ni i wella dealltwriaeth pobol o’r Ymddiriedolaeth a’u profiadau yn ein llefydd ni.”