Ondřej Bojar Livres




Čeština a strojový překlad
- 168pages
- 6 heures de lecture
Knížka přináší souborný popis problematiky strojového překladu, různých přístupů a jejich výhod a nevýhod, včetně otázek vyhodnocování kvality překladu. Čeština jako podkladový jazyk potvrzuje svou vynikající roli, neboť pro zachycení českých jazykových jevů je zapotřebí bohaté teorie, a zároveň existuje dostatek nástrojů a anotovaných i neanotovaných textových dat. Strojový překlad představuje výzvu pro lingvisty, filozofy, informatiky a statistiky; pro počítačovou lingvistiku je to výkladní skříň jazykových jevů a zajímavých problémů. Čeština není v této oblasti zanedbávána, naopak. Kromě jazykovědných teorií českých lingvistů se můžeme opřít o rozsáhlé sbírky českých a česko-anglických textů, které byly obohaceny o podrobné rozbory a anotace. Díky tomu je čeština vynikajícím studijním materiálem i pro mezinárodní vědeckou veřejnost, a mezi češtinou a angličtinou se každoročně konají soutěže. Každý programátor si dnes může sestavit vlastní strojový překladač z volně dostupných součástí. Je čas souborně představit téma strojového překladu širšímu publiku. Důraz je kladen na vysvětlení nejpodstatnějších částí aktuálních teorií, přístupů a algoritmů, přičemž četné ilustrace usnadní pochopení. Snad vás téma zaujme, a pokud přiložíte ruku k dílu, můžeme udržet náskok, který má čeština ve srovnání s ostatními slovanskými jazyky.
This white paper is part of a series aimed at enhancing understanding of language technology and its possibilities. It targets educators, journalists, politicians, language communities, and others. The availability and application of language technology across Europe varies by language, necessitating tailored actions to support research and development for each language. These actions are influenced by factors such as language complexity and community size. META-NET, a Network of Excellence funded by the European Commission, has analyzed current language resources and technologies, focusing on the 23 official European languages and other significant national and regional languages. Findings indicate substantial research gaps for each language. A thorough expert analysis will help optimize the impact of further research while reducing risks. META-NET comprises 54 research centers across 33 countries, collaborating with stakeholders from various sectors, including businesses, government, industry, research organizations, software companies, technology providers, and universities. Together, they aim to establish a unified technology vision and develop a strategic research agenda to address identified research gaps by 2020.