Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy lub języki obce

Kategoria, numer i data zgłoszenia: WYN: [WIPO ST 10/C PL398621], 26-03-2012

Przedmiot wynalazku. Przedmiotem wynalazku jest translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy lub języki obce, który może mieć szerokie zastosowanie jako program tłumaczący zainstalowany na komputerze osobistym, w telefonie komórkowym nowej generacji, tłumaczu elektronicznym, jak również na serwerze operatora oferującego możliwość tłumaczenia tekstu translatorem według wynalazku.
Stan techniki. Istniejące translatory komputerowe cechują się dużym stopniem zawodności w jakości tłumaczenia. Niektóre z nich np. translator firmy Google są zawodne, ponieważ nie są w stanie poprawnie rozpoznać wieloznaczności znaczeń użytych słów a następnie rozróżnić i wybrać z nich właściwego znaczenia i/lub określić właściwą formę fleksyjną. Inne translatory nie posiadają satysfakcjonującego zasobu słownictwa, w szczególności słownictwa specjalistycznego. Jeszcze inne translatory łączą wszystkie w/w niedoskonałości. Firma Google oferuje możliwość tłumaczenia tekstu na wiele różnych języków. Proces tłumaczenia występuje w trzech wersjach. W wersji pierwszej osoba tłumacząca zamierza przetłumaczyć tekst źródłowy, napisany w języku, którego osoba ta nie zna. Tekst ten zostaje przetłumaczona na język docelowy znany osobie tłumaczącej. W tym przypadku istnieje możliwość usuwania wieloznaczności słów lub zwrotów tylko i wyłącznie w przetłumaczonym tekście docelowym, co przy nieznajomości języka tekstu źródłowego przez osobę tłumaczącą, uniemożliwia zweryfikowanie poprawności usunięcia wieloznaczności i tym samym poprawne przetłumaczenie tekstu źródłowego. W wersji drugiej osoba tłumacząca zamierza przetłumaczyć tekst źródłowy, napisany w języku, który osoba ta zna. Tekst ten zostaje przetłumaczona na język docelowy nie znany osobie tłumaczącej. W tym przypadku istnieje możliwość usuwania wieloznaczności słów lub zwrotów tylko i wyłącznie w przetłumaczonym tekście docelowym, co przy nieznajomości języka tekstu docelowego przez osobę tłumaczącą, uniemożliwia zweryfikowanie poprawności usunięcia wieloznaczności i tym samym poprawne przetłumaczenie tekstu źródłowego. W wersji trzeciej osoba korzystająca z internetu zamierzając przetłumaczyć tekst na wybranej stronie internetowej wprowadza adres internetowy tej strony w okno translatora, po czym wybiera polecenie „tłumacz”, w wyniku czego wskazana strona internetowa jest tłumaczona a następnie wyświetlana na podstronie strony firmy Google. Efektem tłumaczenia jest tekst docelowy z możliwością „zaproponowania lepszego tłumaczenia” ale bez możliwości usuwania wieloznaczności słów i zwrotów. Wersja ta również jest obciążona niedoskonałością polegającą na niemożliwości zweryfikowania poprawności przetłumaczonego tekstu przez osobę tłumaczącą, nieznającą języka źródłowego.
Istota wynalazku. Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy lub języki obce, pozwala na rozróżnienie wieloznaczności znaczeń użytych słów i wybranie z nich właściwego znaczenia. Translator według wynalazku jest dedykowany osobom, którym zależy na wysokiej jakości i poprawności tłumaczenia tekstu na język obcy, i w tym celu zamierzają poddać edycji tekst źródłowy napisany w języku sobie znanym podczas pracy nad tekstem, poprzez eliminację wieloznaczności wyrazów i zwrotów. Na tej innowacyjności polega główna zaleta translatora według wynalazku, która skutkuje uzyskaniem wiernego tłumaczenia na dowolnie wybrany język docelowy. Translator według wynalazku może mieć wiele platform zastosowania, niemniej zasada jego działania oparta jest na jednym podstawowym mechanizmie. Mechanizm ten polega na odpowiednim przygotowaniu tekstu źródłowego poprzez usunięcie wieloznaczności wyrazów i zwrotów, który następnie jest zapisany w formie uniwersalnego kodu, nazwanego językiem jądra, dzięki czemu uzyskujemy wierne tłumaczenie języka jądra na dowolnie wybrany język docelowy, dostępny w konfiguracji programu. Uzyskanie języka jądra jest silnym atutem wynalazku, bowiem język jądra umożliwia przekład „oczyszczonego” testu na wiele języków z zachowaniem perfekcji tłumaczenia, pozwalając uzyskać blisko 100% skuteczność bezbłędnego tłumaczenia tekstu źródłowego. Usuwanie wieloznaczności wyrazów i zwrotów odbywa się w następujący sposób: interfejs programu tłumaczącego podzielony jest na dwa okna, z których jedno przeznaczone jest do wpisywania lub wklejania tekstu źródłowego, natomiast drugie okno przeznaczone jest do wyświetlania tekstu docelowego w wybranym języku w czasie rzeczywistym bądź po zakończeniu procesu eliminacji wieloznaczności wyrazów i zwrotów. Z okna z tekstem docelowym osoba tłumacząca może w dowolnej chwili skopiować tekst i go wykorzystać. Wyrazy i zwroty tekstu w oknie źródłowym, które cechują się wieloznacznością są podświetlone i poprzez wskazanie tego słowa lub zwrotu wyświetlają się możliwe znaczenia danego wyrazu lub zwrotu. Wybór poprawnego znaczenia danego wyrazu lub zwrotu odbywa się poprzez wybranie synonimu lub opisu danego wyrazu lub zwrotu. Przykładem może być słowo „mamy”, które może mieć trzy znaczenia: 1 – „posiadamy” w sensie „mamy samochód”; 2 – „matki” w sensie „kochamy nasze mamy”; 3 – „matka” w sensie „siostra mojej mamy”. Każdy wyraz w oknie źródłowym może być także zaznaczony jako nazwa własna nie podlegająca tłumaczeniu. Po wybraniu właściwego znaczenia słowa, translator zapisuje je w odpowiedniej formie języka jądra. Język jądra może mieć formę języka polskiego ze znacznikami. W przypadku jednoznaczności słowa, występują znaczniki: znacznik „1” dla tego słowa, które podlega tłumaczeniu, oraz znacznik „2” dla tego samego słowa, będącego nazwą własną nie podlegającą tłumaczeniu. W przypadku wieloznaczności danego słowa, przypisywane są temu słowu odpowiednie ilości znaczników w ilości znaczeń danego słowa plus nazwa własna nie podlegająca tłumaczeniu. I tak w przypadku słowa „mamy” otrzymujemy w języku jądra cztery możliwe wersje danego słowa: „mamy1” -posiadamy, „mamy2” -matki, „mamy3”- matka, „mamy4” – nazwa własna. W tekście źródłowym mogą się znaleźć również dwuznaczne zwroty, takie jak idiomy, np.: „wszystko mieć pod ręką” czy „szukać dziury w całym”. W takim przypadku osoba edytująca tekst źródłowy wskazuje, czy niniejszy zwrot jest idiomem, czy wyrazy mają inne znaczenie. Język jądra, zdefiniowany poprzez usunięcie wieloznaczności słów, pozwala precyzyjnie przetłumaczyć tekst na dowolny język, występujący w „bibliotece” translatora według wynalazku. Bibliotekę translatora stanowią co najmniej dwa języki a ich ilość uzależniona jest od wersji i konfiguracji programu. Docelowo translator według wynalazku może być precyzyjnym tłumaczem wszystkich języków naturalnych świata z każdego dowolnego języka naturalnego świata na dowolny inny język naturalny świata. Usuwanie wieloznaczności wyrazów i zwrotów, będące „edycją” języka jądra, może przebiegać z poziomu dowolnie wybranego języka naturalnego znajdującego się w bibliotece translatora według wynalazku. Usunięcie wieloznaczności słów z tekstu źródłowego i zapisanie go w postaci języka jądra wymaga zastosowania odpowiednich algorytmów, pozwalających tworzyć język jądra z zachowaniem wszystkich reguł poprawności tego języka, wyjątek stanowi język polski jeżeli językiem jądra są wyrazy języka polskiego ze znacznikami, ponieważ w takim przypadku zachowane są wszystkie reguły poprawności tego języka. Ze względu na różnorodną budowę zdań w różnych językach naturalnych, tekst sprowadzony do postaci języka jądra, tłumaczony jest na wybrany język docelowy, z zastosowaniem indywidualnych algorytmów dla danego języka docelowego. W celu uzyskania wysokiej skuteczności tłumaczonego tekstu, wyrazy języka jądra oprócz znaczników znaczności danego wyrazu, mogą posiadać dodatkowe znaczniki określające: części mowy – rzeczownik, czasownik, przymiotnik itd., części zdania -podmiot, orzeczenie itd., deklinacje, koniugacje czy rodzaje. Wzbogacenie wyrazów języka jądra o powyższe informacje pozwoli zastosowanym algorytmom na precyzyjną budowę zdania tłumaczonego tekstu.
Przykład wykonania wynalazku. Wynalazek przedstawiono w przykładzie wykonania gdzie stworzony został program komputerowy, którego interfejs podzielony jest na dwa okna, z których jedno przeznaczone jest do wpisywania lub wklejania tekstu źródłowego, natomiast drugie okno przeznaczone jest do wyświetlania tekstu docelowego w wybranym języku w czasie rzeczywistym bądź po zakończeniu procesu eliminacji wieloznaczności wyrazów i zwrotów. Z okna z tekstem docelowym osoba tłumacząca może w dowolnej chwili skopiować tekst i go wykorzystać. Wyrazy i zwroty tekstu w oknie źródłowym, które cechują się wieloznacznością są podświetlone i poprzez wskazanie tego słowa lub zwrotu wyświetlają się możliwe znaczenia danego wyrazu lub zwrotu. Wybór poprawnego znaczenia danego wyrazu lub zwrotu odbywa się poprzez wybranie synonimu lub opisu danego wyrazu lub zwrotu. Przykładem może być słowo „mamy”, które może mieć trzy znaczenia: 1 – „posiadamy” w sensie „mamy samochód”; 2 – „matki” w sensie „kochamy nasze mamy”; 3 – „matka” w sensie „siostra mojej mamy”. Każdy wyraz w oknie źródłowym może być także zaznaczony jako nazwa własna nie podlegająca tłumaczeniu. Po wybraniu właściwego znaczenia słowa, translator zapisuje je w odpowiedniej formie języka jądra. Język jądra może mieć formę języka polskiego ze znacznikami. W przypadku jednoznaczności słowa, występują znaczniki: znacznik „1” dla tego słowa, które podlega tłumaczeniu, oraz znacznik „2” dla tego samego słowa, będącego nazwą własną nie podlegającą tłumaczeniu. W przypadku wieloznaczności danego słowa, przypisywane są temu słowu odpowiednie ilości znaczników w ilości znaczeń danego słowa plus nazwa własna nie podlegająca tłumaczeniu. I tak w przypadku słowa „mamy” otrzymujemy w języku jądra cztery możliwe wersje danego słowa:„mamy1” -posiadamy, „mamy2” -matki, „mamy3” – matka, „mamy4” – nazwa własna. W tekście źródłowym mogą się znaleźć również dwuznaczne zwroty, takie jak idiomy, np.: „wszystko mieć pod ręką” czy „szukać dziury w całym”. W takim przypadku osoba edytująca tekst źródłowy wskazuje, czy niniejszy zwrot jest idiomem, czy wyrazy mają inne znaczenie. Język jądra, zdefiniowany poprzez usunięcie wieloznaczności słów, pozwala precyzyjnie przetłumaczyć tekst na dowolny język, występujący w „bibliotece” translatora według wynalazku. Bibliotekę translatora stanowią co najmniej dwa języki a ich ilość uzależniona jest od wersji i konfiguracji programu. Docelowo translator według wynalazku może być precyzyjnym tłumaczem wszystkich języków naturalnych świata z każdego dowolnego języka naturalnego świata na dowolny inny język naturalny świata. Usuwanie wieloznaczności wyrazów i zwrotów, będące „edycją” języka jądra, może przebiegać z poziomu dowolnie wybranego języka naturalnego znajdującego się w bibliotece translatora według wynalazku. Usunięcie wieloznaczności słów z tekstu źródłowego i zapisanie go w postaci języka jądra wymaga zastosowania odpowiednich algorytmów, pozwalających tworzyć język jądra z zachowaniem wszystkich reguł poprawności tego języka, wyjątek stanowi język polski jeżeli językiem jądra są wyrazy języka polskiego ze znacznikami, ponieważ w takim przypadku zachowane są wszystkie reguły poprawności tego języka. Ze względu na różnorodną budowę zdań w różnych językach naturalnych, tekst sprowadzony do postaci języka jądra, tłumaczony jest na wybrany język docelowy, z zastosowaniem indywidualnych algorytmów dla danego języka docelowego. W celu uzyskania wysokiej skuteczności tłumaczonego tekstu, wyrazy języka jądra oprócz znaczników znaczności danego wyrazu, mogą posiadać dodatkowe znaczniki określające: części mowy – rzeczownik, czasownik, przymiotnik itd., części zdania -podmiot, orzeczenie itd., deklinacje, koniugacje czy rodzaje. Wzbogacenie wyrazów języka jądra o powyższe informacje pozwoli zastosowanym algorytmom na precyzyjną budowę zdania tłumaczonego tekstu.
Zastosowanie wynalazku. Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy lub języki obce, może mieć szerokie zastosowanie jako program tłumaczący zainstalowany na komputerze osobistym, w telefonie komórkowym nowej generacji, tłumaczu elektronicznym, jak również na serwerze operatora oferującego możliwość tłumaczenia tekstu translatorem według wynalazku. Translator według wynalazku może mieć również formę programu komputerowego odpowiednio modyfikującego kody HTML, XHTML i PHP stron internetowych, co pozwoli za pomocą przystosowanej przeglądarki internetowej na automatyczne tłumaczenie tekstu w wielu językach. Translator według wynalazku może mieć również formę komunikatora internetowego pozwalającego na prowadzenie czatu w czasie rzeczywistym dając bardzo wysoką poprawność i wierność prowadzonej konwersacji. Translator według wynalazku może mieć również formę programu pocztowego do pisania poprawnie przetłumaczonych listów e-mail. Translator według wynalazku może być również stosowany w narzędziach programistycznych typu Delphi czy Borland C++, dając możliwość tworzenia programów komputerowych z „uniwersalną” platformą językową, dzięki czemu stworzony program mógłby być uniwersalny językowo, gdyż poprzez wybranie odpowiedniej komendy, byłby czytelny w wielu językach naturalnych świata. Translator według wynalazku może być również stosowany podczas prac nad opracowaniem systemu operacyjnego komputerów i innych elektronicznych urządzeń, co docelowo pozwala, poprzez wybranie odpowiedniej komendy, na korzystanie z takiego systemu osobom wielu narodowości, z których każda posługuje się innym językiem naturalnym świata. Translator komputerowy według wynalazku może okazać się przełomowym narzędziem na skalę światową, dając wszystkim korzystającym z translatora możliwość bezbłędnej komunikacji bez granic.