Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy lub języki obce
Kategoria, numer i data zgłoszenia:
WYN: [WIPO ST 10/C PL398621], 26-03-2012

Przedmiot wynalazku. Przedmiotem wynalazku jest translator komputerowy o wysokim współczynniku poprawności
tłumaczenia tekstu na język obcy lub języki obce, który może mieć szerokie zastosowanie jako program tłumaczący
zainstalowany na komputerze osobistym, w telefonie komórkowym nowej generacji, tłumaczu elektronicznym, jak
również na serwerze operatora oferującego możliwość tłumaczenia tekstu translatorem według wynalazku.

Stan techniki. Istniejące translatory komputerowe cechują się dużym stopniem zawodności w jakości tłumaczenia.
Niektóre z nich np. translator firmy Google są zawodne, ponieważ nie są w stanie poprawnie rozpoznać
wieloznaczności znaczeń użytych słów a następnie rozróżnić i wybrać z nich właściwego znaczenia i/lub określić
właściwą formę fleksyjną. Inne translatory nie posiadają satysfakcjonującego zasobu słownictwa, w szczególności
słownictwa specjalistycznego. Jeszcze inne translatory łączą wszystkie w/w niedoskonałości.
     Firma Google oferuje możliwość tłumaczenia tekstu na wiele różnych języków. Proces tłumaczenia występuje w
trzech wersjach. W wersji pierwszej osoba tłumacząca zamierza przetłumaczyć tekst źródłowy, napisany w języku,
którego osoba ta nie zna. Tekst ten zostaje przetłumaczona na język docelowy znany osobie tłumaczącej. W tym
przypadku istnieje możliwość usuwania wieloznaczności słów lub zwrotów tylko i wyłącznie w przetłumaczonym
tekście docelowym, co przy nieznajomości języka tekstu źródłowego przez osobę tłumaczącą, uniemożliwia
zweryfikowanie poprawności usunięcia wieloznaczności i tym samym poprawne przetłumaczenie tekstu
źródłowego. W wersji drugiej osoba tłumacząca zamierza przetłumaczyć tekst źródłowy, napisany w języku, który
osoba ta zna. Tekst ten zostaje przetłumaczona na język docelowy nie znany osobie tłumaczącej. W tym
przypadku istnieje możliwość usuwania wieloznaczności słów lub zwrotów tylko i wyłącznie w przetłumaczonym
tekście docelowym, co przy nieznajomości języka tekstu docelowego przez osobę tłumaczącą, uniemożliwia
zweryfikowanie poprawności usunięcia wieloznaczności i tym samym poprawne przetłumaczenie tekstu
źródłowego. W wersji trzeciej osoba korzystająca z internetu zamierzając przetłumaczyć tekst na wybranej stronie
internetowej wprowadza adres internetowy tej strony w okno translatora, po czym wybiera polecenie „tłumacz”, w
wyniku czego wskazana strona internetowa jest tłumaczona a następnie wyświetlana na podstronie strony firmy
Google. Efektem tłumaczenia jest tekst docelowy z możliwością „zaproponowania lepszego tłumaczenia” ale bez
możliwości usuwania wieloznaczności słów i zwrotów. Wersja ta również jest obciążona niedoskonałością
polegającą na niemożliwości zweryfikowania poprawności przetłumaczonego tekstu przez osobę tłumaczącą, nie
znającą języka źródłowego.

Istota wynalazku. Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu na język obcy
lub języki obce, pozwala na rozróżnienie wieloznaczności znaczeń użytych słów i wybranie z nich właściwego
znaczenia. Translator według wynalazku jest dedykowany osobom, którym zależy na wysokiej jakości i poprawności
tłumaczenia tekstu na język obcy, i w tym celu zamierzają poddać edycji tekst źródłowy napisany w języku sobie
znanym podczas pracy nad tekstem, poprzez eliminację wieloznaczności wyrazów i zwrotów. Na tej
innowacyjności polega główna zaleta translatora według wynalazku, która skutkuje uzyskaniem wiernego
tłumaczenia na dowolnie wybrany język docelowy.
     Translator według wynalazku może mieć wiele platform zastosowania, niemniej zasada jego działania oparta jest
na jednym podstawowym mechanizmie. Mechanizm ten polega na odpowiednim przygotowaniu tekstu źródłowego
poprzez usunięcie wieloznaczności wyrazów i zwrotów, który następnie jest zapisany w formie uniwersalnego kodu,
nazwanego językiem jądra, dzięki czemu uzyskujemy wierne tłumaczenie języka jądra na dowolnie wybrany język
docelowy, dostępny w konfiguracji programu. Uzyskanie języka jądra jest silnym atutem wynalazku, bowiem język
jądra umożliwia przekład „oczyszczonego” testu na wiele języków z zachowaniem perfekcji tłumaczenia,
pozwalając uzyskać blisko 100% skuteczność bezbłędnego tłumaczenia tekstu
źródłowego.
     Usuwanie wieloznaczności wyrazów i zwrotów odbywa się w następujący sposób: interfejs programu
tłumaczącego podzielony jest na dwa okna, z których jedno przeznaczone jest do wpisywania lub wklejania tekstu
źródłowego, natomiast drugie okno przeznaczone jest do wyświetlania tekstu docelowego w wybranym języku w
czasie rzeczywistym bądź po zakończeniu procesu eliminacji wieloznaczności wyrazów i zwrotów. Z okna z
tekstem docelowym osoba tłumacząca może w dowolnej chwili skopiować tekst i go wykorzystać. Wyrazy i zwroty
tekstu w oknie źródłowym, które cechują się wieloznacznością są podświetlone i poprzez wskazanie tego słowa lub
zwrotu wyświetlają się możliwe znaczenia danego wyrazu lub zwrotu. Wybór poprawnego znaczenia danego
wyrazu lub zwrotu odbywa się poprzez wybranie synonimu lub opisu danego wyrazu lub zwrotu. Przykładem może
być słowo „mamy”, które może mieć trzy znaczenia: 1 - „posiadamy” w sensie „mamy samochód”; 2 - „matki” w
sensie „kochamy nasze mamy”; 3 - „matka” w sensie „siostra mojej mamy”. Każdy wyraz w oknie źródłowym może
być także zaznaczony jako nazwa własna nie podlegająca tłumaczeniu. Po wybraniu właściwego znaczenia słowa,
translator zapisuje je w odpowiedniej formie języka jądra. Język jądra może mieć formę języka polskiego ze
znacznikami. W przypadku jednoznaczności słowa, występują znaczniki: znacznik „1” dla tego słowa, które podlega
tłumaczeniu, oraz znacznik „2” dla tego samego słowa, będącego nazwą własną nie podlegającą tłumaczeniu. W
przypadku wieloznaczności danego słowa, przypisywane są temu słowu odpowiednie ilości znaczników w ilości
znaczeń danego słowa plus nazwa własna nie podlegająca tłumaczeniu. I tak w przypadku słowa „mamy”
otrzymujemy w języku jądra cztery możliwe wersje danego słowa: „mamy1” -posiadamy, „mamy2” -matki, „mamy3”
- matka, „mamy4” - nazwa własna.
     W tekście źródłowym mogą się znaleźć również dwuznaczne zwroty, takie jak idiomy, np.: „wszystko mieć pod
ręką” czy „szukać dziury w całym”. W takim przypadku osoba edytująca tekst źródłowy wskazuje, czy niniejszy
zwrot jest idiomem, czy wyrazy mają inne znaczenie. Język jądra, zdefiniowany poprzez usunięcie wieloznaczności
słów, pozwala precyzyjnie przetłumaczyć tekst na dowolny język, występujący w „bibliotece” translatora według
wynalazku.
     Bibliotekę translatora stanowią co najmniej dwa języki a ich ilość uzależniona jest od wersji i konfiguracji
programu. Docelowo translator według wynalazku może być precyzyjnym tłumaczem wszystkich języków
naturalnych świata z każdego dowolnego języka naturalnego świata na dowolny inny język naturalny świata.
Usuwanie wieloznaczności wyrazów i zwrotów, będące „edycją” języka jądra, może przebiegać z poziomu dowolnie
wybranego języka naturalnego znajdującego się w bibliotece translatora według wynalazku. Usunięcie
wieloznaczności słów z tekstu źródłowego i zapisanie go w postaci języka jądra wymaga zastosowania
odpowiednich algorytmów, pozwalających tworzyć język jądra z zachowaniem wszystkich reguł poprawności tego
języka, wyjątek stanowi język polski jeżeli językiem jądra są wyrazy języka polskiego ze znacznikami, ponieważ w
takim przypadku zachowane są wszystkie reguły poprawności tego języka. Ze względu na różnorodną budowę zdań
w różnych językach naturalnych, tekst sprowadzony do postaci języka jądra, tłumaczony jest na wybrany język
docelowy, z zastosowaniem indywidualnych algorytmów dla danego języka docelowego. W celu uzyskania wysokiej
skuteczności tłumaczonego tekstu, wyrazy języka jądra oprócz znaczników znaczności danego wyrazu, mogą
posiadać dodatkowe znaczniki określające: części mowy - rzeczownik, czasownik, przymiotnik itd., części zdania -
podmiot, orzeczenie itd., deklinacje, koniugacje czy rodzaje. Wzbogacenie wyrazów języka jądra o powyższe
informacje pozwoli zastosowanym algorytmom na precyzyjną budowę zdania tłumaczonego tekstu.

Przykład wykonania wynalazku. Wynalazek przedstawiono w przykładzie wykonania gdzie stworzony został
program komputerowy, którego interfejs podzielony jest na dwa okna, z których jedno przeznaczone jest do
wpisywania lub wklejania tekstu źródłowego, natomiast drugie okno przeznaczone jest do wyświetlania tekstu
docelowego w wybranym języku w czasie rzeczywistym bądź po zakończeniu procesu eliminacji wieloznaczności
wyrazów i zwrotów. Z okna z tekstem docelowym osoba tłumacząca może w dowolnej chwili skopiować tekst i go
wykorzystać. Wyrazy i zwroty tekstu w oknie źródłowym, które cechują się wieloznacznością są podświetlone i
poprzez wskazanie tego słowa lub zwrotu wyświetlają się możliwe znaczenia danego wyrazu lub zwrotu.
Wybór poprawnego znaczenia danego wyrazu lub zwrotu odbywa się poprzez wybranie synonimu lub opisu danego
wyrazu lub zwrotu. Przykładem może być słowo „mamy”, które może mieć trzy znaczenia: 1 - „posiadamy” w
sensie „mamy samochód”; 2 - „matki” w sensie „kochamy nasze mamy”; 3 - „matka” w sensie „siostra mojej
mamy”. Każdy wyraz w oknie źródłowym może być także zaznaczony jako nazwa własna nie podlegająca
tłumaczeniu. Po wybraniu właściwego znaczenia słowa, translator zapisuje je w odpowiedniej formie języka jądra.
Język jądra może mieć formę języka polskiego ze znacznikami. W przypadku jednoznaczności słowa, występują
znaczniki: znacznik „1” dla tego słowa, które podlega tłumaczeniu, oraz znacznik „2” dla tego samego słowa,
będącego nazwą własną nie podlegającą tłumaczeniu. W przypadku wieloznaczności danego słowa, przypisywane
są temu słowu odpowiednie ilości znaczników w ilości znaczeń danego słowa plus nazwa własna nie podlegająca
tłumaczeniu. I tak w przypadku słowa „mamy” otrzymujemy w języku jądra cztery możliwe wersje danego słowa:
„mamy1” -posiadamy, „mamy2” -matki, „mamy3” - matka, „mamy4” - nazwa własna.
     W tekście źródłowym mogą się znaleźć również dwuznaczne zwroty, takie jak idiomy, np.: „wszystko mieć pod
ręką” czy „szukać dziury w całym”. W takim przypadku osoba edytująca tekst źródłowy wskazuje, czy niniejszy
zwrot jest idiomem, czy wyrazy mają inne znaczenie. Język jądra, zdefiniowany poprzez usunięcie wieloznaczności
słów, pozwala precyzyjnie przetłumaczyć tekst na dowolny język, występujący w „bibliotece” translatora według
wynalazku.
     Bibliotekę translatora stanowią co najmniej dwa języki a ich ilość uzależniona jest od wersji i konfiguracji
programu. Docelowo translator według wynalazku może być precyzyjnym tłumaczem wszystkich języków
naturalnych świata z każdego dowolnego języka naturalnego świata na dowolny inny język naturalny świata.
Usuwanie wieloznaczności wyrazów i zwrotów, będące „edycją” języka jądra, może przebiegać z poziomu dowolnie
wybranego języka naturalnego znajdującego się w bibliotece translatora według wynalazku. Usunięcie
wieloznaczności słów z tekstu źródłowego i zapisanie go w postaci języka jądra wymaga zastosowania
odpowiednich algorytmów, pozwalających tworzyć język jądra z zachowaniem wszystkich reguł poprawności tego
języka, wyjątek stanowi język polski jeżeli językiem jądra są wyrazy języka polskiego ze znacznikami, ponieważ w
takim przypadku zachowane są wszystkie reguły poprawności tego języka. Ze względu na różnorodną budowę zdań
w różnych językach naturalnych, tekst sprowadzony do postaci języka jądra, tłumaczony jest na wybrany język
docelowy, z zastosowaniem indywidualnych algorytmów dla danego języka docelowego. W celu uzyskania wysokiej
skuteczności tłumaczonego tekstu, wyrazy języka jądra oprócz znaczników znaczności danego wyrazu, mogą
posiadać dodatkowe znaczniki określające: części mowy - rzeczownik, czasownik, przymiotnik itd., części zdania -
podmiot, orzeczenie itd., deklinacje, koniugacje czy rodzaje. Wzbogacenie wyrazów języka jądra o powyższe
informacje pozwoli zastosowanym algorytmom na precyzyjną budowę zdania tłumaczonego tekstu.

     Zastosowanie wynalazku. Translator komputerowy o wysokim współczynniku poprawności tłumaczenia tekstu
na język obcy lub języki obce, może mieć szerokie zastosowanie jako program tłumaczący zainstalowany na
komputerze osobistym, w telefonie komórkowym nowej generacji, tłumaczu elektronicznym, jak również na
serwerze operatora oferującego możliwość tłumaczenia tekstu translatorem według wynalazku. Translator według
wynalazku może mieć również formę programu komputerowego odpowiednio modyfikującego kody HTML, XHTML i
PHP stron internetowych, co pozwoli za pomocą przystosowanej przeglądarki internetowej na automatyczne
tłumaczenie tekstu w wielu językach. Translator według wynalazku może mieć również formę komunikatora
internetowego pozwalającego na prowadzenie czatu w czasie rzeczywistym dając bardzo wysoką poprawność i
wierność prowadzonej konwersacji. Translator według wynalazku może mieć również formę programu pocztowego
do pisania poprawnie przetłumaczonych listów e-mail. Translator według wynalazku może być również stosowany
w narzędziach programistycznych typu Delphi czy Borland C++, dając możliwość tworzenia programów
komputerowych z „uniwersalną” platformą językową, dzięki czemu stworzony program mógłby być uniwersalny
językowo, gdyż poprzez wybranie odpowiedniej komendy, byłby czytelny w wielu językach naturalnych świata.
Translator według wynalazku może być również stosowany podczas prac nad opracowaniem systemu
operacyjnego komputerów i innych elektronicznych urządzeń, co docelowo pozwala, poprzez wybranie
odpowiedniej komendy, na korzystanie z takiego systemu osobom wielu narodowości, z których każda posługuje się
innym językiem naturalnym świata.
      Translator komputerowy według wynalazku może okazać się przełomowym narzędziem na skalę światową,
dając wszystkim korzystającym z translatora możliwość bezbłędnej komunikacji bez granic.
Pozdrawiam

Radosław Pełka
Copyright © 2013 - 2018 by "Radosław Pełka" • Wszystkie Prawa Zastrzeżone • polityka plików cookies
Radosław Pełka
Radosław Pełka na LinkedIn