A híres Holt-tengeri tekercsek egy része teljes szöveg, de több ezer töredék is van, amelyeket eddig nem lehetett megfejteni.

A Negevi Ben-Gurion Egyetemen által kifejlesztett mesterséges intelligenciával működő rendszer azonban megoldást jelenthet a tekercsek és más ősi szövegek értelmezésére – számol be róla a nocamels.

Az új rendszer a szoftverekkel foglalkozó tanszék négy hallgatójának munkája, akik a negyedik év végi projektjük részeként készítették el. A módszer úgynevezett maszkolt nyelvi modellezést alkalmaz, tehát a szövegkörnyezetet használja fel arra, hogy kikövetkeztesse a mondatban nem kiolvasható héber és arámi nyelven íródott szavakat. Az egész projekt körülbelül egy évig tartott, és mind a négy diák a maximális pontszámot kapta. Először olyan nagyméretű nyelvi modelleket találtak, amelyek kompatibilisek a modern héber nyelvvel, amely az ősi elődjéhez hasonlóan, a nyugati nyelvektől eltérően jobbról balra olvasható, és nem használ római ábécét.

Eztuán elkezdték „felhalmozni” a szöveget, hogy az algoritmus megértse, mit szeretnének tudni. Miután a modern héber adatokat betáplálták, létrehoztak belőlük egy, az ősi héberre épülő modellt.

Mivel kevés volt az arámi nyelvű szöveg, a hangsúlyt a héberre helyezték. Ószövetségi bibliai szövegeket használtak fel, több mint 22 ezer mondatot, ezzel tanítgatták az AI-t.

A modellt, amelyet a csapat Embible-nek nevezett el, az Association for Computational Linguistics európai tagozatának legutóbbi összejövetelén mutatták be, amelyre a múlt hónapban került sor Máltán. Úgy vélik, hogy az Embible másoknak is hasznára lesz, segíthet a történészeknek, akik az életüket annak szentelik, hogy ősi szövegeket a lehető legpontosabban rekonstruáljanak.

 

Megszakítás