Nowa Świadomość i Wijozowia Przyrody (polski językiem źródła) – budowanie wspólnoty tożsamościowej. Nowa Wszechnica

„Polska język, genialna język”. Sztuczna inteligencja pokochała polszczyznę

Badania przeprowadzone przez naukowców wykazały, że język polski najlepiej sprawdza się w pracy z dużymi modelami sztucznej inteligencji, wyprzedzając nawet angielski i chiński.

Badacze z University of Maryland oraz Microsoftu ogłosili zaskakujące wyniki testów dużych modeli językowych – to właśnie język polski okazał się najskuteczniejszy w pracy ze sztuczną inteligencją. Odkrycie to wywołało zdumienie samych naukowców, ponieważ polszczyzna nie należy do języków z największymi zasobami treningowymi. Do tej pory dominowały angielski i chiński, na których zazwyczaj szkoli się modele AI, lecz w tym badaniu oba te języki wypadły znacznie gorzej od polskiego.     

Eksperyment polegał na sprawdzeniu, jak dobrze modele językowe radzą sobie z analizą tzw. długiego kontekstu – czyli zrozumieniem bardzo obszernych tekstów i wyszukiwaniem w nich konkretnych informacji. Naukowcy oceniali także, czy systemy nie zmyślają odpowiedzi, których nie da się wyczytać z przesłanego materiału. W tej kategorii język polski uzyskał imponującą skuteczność – aż 88 procent.Angielski niżej

Dla porównania, angielski znalazł się dopiero na szóstym miejscu spośród 26 języków, osiągając średni wynik 83,9 proc., a chiński uplasował się niemal na końcu zestawienia z wynikiem 62,1 proc.

Pierwszą dziesiątkę rankingu zdominowały języki europejskie – głównie słowiańskie, romańskie i germańskie – które wykorzystują alfabet łaciński i mają bogate zasoby treści w internecie, szczególnie w Wikipedii.

Duża skuteczność

Okazało się również, że języki wysokozasobne, czyli te, w których jest więcej treści, pozwalają na większą dokładność modeli. W zależności od języka dokładność sztucznej inteligencji może się różnić nawet o ok. 20 proc. Według autorów badania może to oznaczać, że warto zwrócić większą uwagę na języki mniej popularne, takie jak polski, które mogą okazać się skuteczniejsze przy trenowaniu modeli językowych.

Choć naukowcy nie wskazali jednoznacznej przyczyny sukcesu polszczyzny, sugerują, że wynika on z jej złożonej struktury gramatycznej. Wielość form fleksyjnych i precyzyjne zasady składniowe mogą ułatwiać modelom językowym rozumienie kontekstu i ograniczać ryzyko błędnych interpretacji. Dzięki temu polski może stanowić wyjątkowo skuteczne narzędzie do testowania i rozwijania sztucznej inteligencji.

źródło: https://www.tvp.info/89675200/badanie-jezyk-polski-najlepszy-do-trenowania-sztucznej-inteligencji-ai

Polski najlepszym językiem dla AI. Angielski dopiero na szóstym miejscu

Język polski, który jest uznawany za jeden z najtrudniejszych języków świata, zaskoczył naukowców swoją wydajnością w kontekście sztucznej inteligencji. W badaniu przeprowadzonym przez naukowców z University of Maryland i Microsoftu zajął pierwsze miejsce w rankingu wydajności długich promptów. Angielski, mimo ogromnych zasobów, uplasował się dopiero na szóstym miejscu.

Wyniki badań przeprowadzonych przez amerykańskich naukowców z University of Maryland i Microsoftu ujawniły zaskakującą „zaletę” polskiego języka. W najnowszym raporcie został on umieszczony na pierwszym miejscu, jeśli chodzi o wydajność obszernych, kontekstowych promptów dla sztucznej inteligencji.

Rezultaty analizy pokazują, że język polski, mimo stosunkowo niewielkich zasobów danych do trenowania modeli AI, może być bardziej efektywny w kontekście długich i złożonych poleceń, niż języki o większej liczbie użytkowników. To odkrycie może mieć znaczenie dla rozwoju technologii AI w Polsce i na świecie, wskazując na potencjał mniejszych języków w globalnym kontekście.

Badanie, które przytacza serwis Benchmark.pl, zatytułowane „One ruler to measure them all: Benchmarking multilingual long-context language models”, objęło 26 języków i kilka modeli AI, w tym OpenAI o3-mini-high, Google Gemini 1.5 Flash oraz Llama 3.3 (70B). Naukowcy testowali wydajność modeli w przetwarzaniu promptów o długości do 128 tys. tokenów. Wyniki były zaskakujące – polski osiągnął najwyższą skuteczność (88 proc.), wyprzedzając m.in. francuski (87 proc.) i włoski (86 proc.).

*

Polski najlepszym językiem dla AI. Angielski dopiero na szóstym miejscu

„Eksperymenty z otwartymi i zamkniętymi modelami LLM ujawniają rosnącą różnicę w wydajności między językami o niskich i wysokich zasobach, wraz ze wzrostem długości kontekstu z 8 tys. do 128 tys. tokenów. Co zaskakujące, język angielski nie jest językiem o najwyższej wydajności w zadaniach długiego kontekstu (zajął 6. miejsce na 26), a na szczyt listy wysuwa się język polski” – napisano w raporcie, który przytacza serwis Benchmark.pl.

Pełna lista wydajności języków w kontekście długich promptów prezentuje się następująco:

  1. Polski – 88 proc.
  2. Francuski – 87 proc.
  3. Włoski – 86 proc.
  4. Hiszpański – 85 proc.
  5. Rosyjski – 84 proc.
  6. Angielski – 83,9 proc.

Wyniki badania mogą być impulsem do większego zaangażowania w rozwój technologii AI w Polsce. Pokazują, że język polski, mimo swojej złożoności, może być atutem w globalnym wyścigu technologicznym. To także dowód na to, że mniejsze języki mogą odgrywać kluczową rolę w przyszłości sztucznej inteligencji.

źródło: https://businessinsider.com.pl/wiadomosci/jezyk-polski-zaskakuje-swiat-ai-sporo-wyprzedza-angielski/hnjl40s

Podziel się!