Results for 2022-03

ensk.is

19.3.2022 kl. 23:04 - Sveinbjörn Þórðarson

Ég er búinn að ritstýra og gefa út frjálsa, opna ensk-íslenska orðabók á vefnum ensk.is. Gjörið þið svo vel!

Í löngu máli: Ég skrifaði fyrst bloggpóst árið 2007 [!] um hve lélegt það væri að enga opna ensk-íslensk orðabók væri að finna á netinu. Ég bjóst við að það myndi lagast með tímanum, en fimmtán árum síðar, árið 2022, eru allar slíkar orðabækur enn lokaðar á bak við greiðslumúr eða í einkaeigu, öllum Íslendingum til mikils ama. Forlagið situr á þessu eins og ormur á gulli og heimtar rentu frá öllum sem þurfa að fletta upp enskum orðum. Þetta er auðvitað til háborinnar skammar því svo gott sem allir Íslendingar, hvar sem þeir eru staddir í lífinu og hversu góðir sem þeir eru í ensku, þurfa á þessum upplýsingum að halda. Þetta eru hreinlega bráðnauðsynlegir tungumálainnviðir. Fyrir vikið ákvað ég að gera eitthvað í málinu. "If you want something done right, you gotta do it yerself," eins og sagt er.

Fyrst heimsótti ég Landsbókasafn og sannfærði fornbókadeildina um að ljóslesa (skanna) ensk-íslenzku orðabók Geirs T. Zoega, 3. útgáfu frá árinu 1932, sem er fallin úr höfundarétti. Síðan tók ég ljóslesnu myndirnar og mataði inn í Optical Character Recognition hugbúnað, og endaði með mjög skítugan, hráan texta. Að því loknu notaði ég margvíslegar sjálfvirkar tölvunarfræðilegar og handvirkar aðferðir til að hreinsa og laga textann, snéri forneskjulegu málfari og stafsetningu yfir á nútímaíslensku (sjer->sér, mentun->menntun, skifting->skipting, verzlun->verslun, o.s.frv.). Illskiljanlegar forneskjulegar skilgreiningar voru uppfærðar til þess að samræmast málnotkun samtímans og fjölmargar villur í stafsetningu og skilgreiningum í frumtextanum leiðréttar. Auk þess bætti ég við nokkrum orðaskilgreiningum sem sárlega vantaði. Það hefur tekið ótrúlega mikið af frítíma mínum undanfarið ár að ritstýra, bæta og fara yfir þessar 30 þúsund skilgreiningar, en nú er þetta loksins komið á frambærilegt snið og gagnast vonandi sem flestum.

Orðabókin er gefin út í almannaeign (e. public domain) og nýtur hvorki höfundar- né einkaleyfisverndar. Öllum er frjálst að sækja hana, afrita, breyta og endurbirta að vild. Kóðinn á bak við hraða, einfalda og skilvirka vefinn er opinn á GitHub undir BSD leyfi.

Separator