Władze Flandrii zdecydowały o stworzeniu własnego systemu automatycznego generowania napisów, który ma radzić sobie z bogatą różnorodnością lokalnych dialektów i odmian języka potocznego. Na realizację projektu przeznaczono budżet przekraczający milion euro. Inicjatywa ma zwiększyć dostępność treści wideo dla szerokiego grona odbiorców – od osób niedosłyszących po mieszkańców, którzy nie posługują się biegle językiem niderlandzkim. Projekt będzie prowadzony we współpracy między czołowymi koncernami medialnymi – publicznym nadawcą VRT, Play Media, DPG Media i NORTV (zrzeszeniem regionalnych stacji telewizyjnych) – oraz uczelniami wyższymi i partnerami technologicznymi.
Treści wideo rosną szybciej niż możliwości ich opracowania
Materiały wideo zajmują coraz więcej miejsca w codziennym życiu mieszkańców Flandrii. Platformy streamingowe, takie jak VRT MAX czy Play.tv, portale informacyjne i media społecznościowe codziennie dostarczają ogromną liczbę treści audiowizualnych. Tymczasem możliwości profesjonalnych twórców napisów nie nadążają za rosnącą podażą materiałów.
Istniejące systemy automatycznego tworzenia napisów często zawodzą w kontakcie z flamandzką różnorodnością językową. Głównym wyzwaniem są liczne dialekty i charakterystyczne akcenty, z którymi sztuczna inteligencja nie radzi sobie wystarczająco dobrze. Flamandzka minister ds. mediów Cieltje Van Achter z partii N-VA podkreśla, że każdy, kto korzysta z treści online, zna ten problem: automatyczne napisy mylą słowa, nie rozpoznają dialektów i generują tekst trudny do zrozumienia.
Szczegóły finansowania i partnerzy projektu
Całkowity budżet projektu wynosi 1,027 miliona euro, z czego 749 tysięcy euro pochodzi bezpośrednio ze środków ministerstwa ds. mediów. „Projekt Automatycznych Napisów” potrwa dwa lata i obejmuje szeroką współpracę instytucjonalną. W przedsięwzięciu uczestniczą KU Leuven, Uniwersytet Antwerpski oraz IMEC – instytut badawczy specjalizujący się w nanoelektronice i technologiach cyfrowych.
Lieven Vermaele, dyrektor ds. partnerstw, danych i sztucznej inteligencji w VRT, podkreśla znaczenie projektu dla misji publicznego nadawcy. Jak zauważa, zapewnienie dostępności treści dla wszystkich mieszkańców Flandrii jest podstawowym obowiązkiem nadawcy publicznego, a wysokiej jakości napisy są szczególnie ważne dla osób, które nie mogą polegać wyłącznie na dźwięku.
Rosnące zapotrzebowanie społeczne
Minister Van Achter wskazuje, że nawyki odbiorców mediów zmieniają się szybko. Coraz więcej osób ogląda materiały wideo z włączonymi napisami – nie tylko osoby niedosłyszące, lecz także młodzi użytkownicy śledzący treści w podróży oraz osoby, które nie posługują się językiem niderlandzkim na co dzień. W efekcie niedoskonałe napisy stają się problemem coraz bardziej odczuwalnym.
Projekt odpowiada również na rosnące wymagania prawne. Zarówno przepisy europejskie, jak i flamandzkie nakładają obowiązek zapewnienia czytelnych i poprawnych napisów. Widzowie oczekują, że napisy będą nie tylko dostępne, ale też rzetelne i łatwe do śledzenia.
Trzy filary innowacji
Projekt zakłada stworzenie rozwiązań w trzech powiązanych ze sobą obszarach. Pierwszy to flamandzki model rozpoznawania mowy, który będzie w stanie przekształcać na tekst różnorodne dialekty, akcenty i lokalne formy języka. Drugi to model generowania napisów, który ma nadać transkrypcjom płynność i czytelność. Trzeci filar stanowi system testowania i doskonalenia jakości napisów.
Jak wyjaśnia Vermaele, proces tworzenia napisów wymaga znalezienia równowagi między wiernością przekazu, czytelnością a naturalnym rytmem wypowiedzi. Przeniesienie tego zadania na niezawodny system automatyczny będzie istotnym krokiem w kierunku przyszłości, w której dostępność i innowacyjność staną się standardem w mediach.