Site icon Telegrafi

Ndodh ndryshimi revolucionar me gjuhën shqipe, detaje nga programi që përmbajtjet audio vizuale i kthen në tekst

Gjuha shqipe ka qenë ndër të paktat që deri më tani nuk ka mundur të shndërrohet nga gjuha e folur në të shkruar përmes ndihmës së Inteligjencës Artificiale.

Mirëpo ndryshimi revolucionar ka ndodhur. Të enjten e 28 prillit kompania Quantix ka prezantuar softuerin që bazohet në Inteligjencë Artificiale, përmes së cilit gjuha shqipe do të transkriptohet në mënyrë automatike nga përmbajtjet audio-vizuale në forma të tekstit të shkruar.

Për më tepër se kaq, teksti do të shkarkohet i gatshëm në disa forma të përshtatshme për t’u përdorur në media, gjykata apo institucione të tjera shtetërore.

Në Qendrën e Inovacionit në Kosovë (ICK) drejtuesit e kompanisë Quantix prezantuan specifikat e implementimit të projektit “Albanian Speech to Text” që mund t’i qaseni përmes Shqip.ai.

Alba Kelmendi nga Quantix tha se ka qenë problematike që gjuha shqipe nuk ka qenë e mundur të transkriptohet në mënyrë automatike.

Lexo po ashtu Lansohet Shqip.ai - transkriptim me Inteligjencë Artificiale për gjuhën shqipe

“Platforma shqip.ai e ka zgjidhur tashmë këtë problem. Secilën fjalë që dëgjohet në video/audio apo që folët në mënyrë të drejtpërdrejtë e kthen në gjuhë të shkruar”.

Kelmendi thotë se ky transkriptim mund të bëhet në të gjitha dialektet me një saktësi prej 90%.

“Kjo është një e arritur tepër e madhe që është arritur në teknologjinë e kompjuterëve sa i përket gjuhës shqipe. Transkriptet përfshijnë dialektet e Kosovës, Shqipërisë, Maqedonisë së Veriut e poashtu edhe nëndialektet”, ka deklaruar tutje Kelmendi.

Drejtori ekzekutiv i Quantix , Betim Drenica, para të pranishmëve ka demonstruar se si produkti transkripton seancën e Kuvendit të Kosovës më një saktësi pothuajse 100%.

Ai ka thënë se gjuha shqipe ka qenë shumë e mangët në aspektin e digjitalizimit të të dhënave dhe sipas tij për ndërtimin e këtij projekti është dashur të fillohet nga zeroja.

“Ne si kompani kemi punësuar qindra lexues në gjuhen shqipe për llogari të programit. Kemi arritur të ndërtojmë një “data set” që është mijëra orësh. Këto të dhëna janë validuar sërish para se të futen në sistem. Kjo është një punë e jashtëzakonshme. Gjithsejtë kemi mbi 500 GB të dhëna që është larg nga çdo dataset që ka ekzistuar deri më tani, që janë kryesisht tema të diplomave apo të ngjashëm. Asnjë institucion në Kosovë nuk ka sasi më të madhe të materialeve audio”, ka shpjeguar tutje Drenica./Telegrafi/

Exit mobile version