LanguageTool

LanguageTool
Logo LanguageTool
Logo programu
ilustracja
Autor Daniel Naber and Marcin Miłkowski
Pierwsze wydanie 2005-08-15 15 sierpnia 2005(dts)
Aktualna wersja stabilna 6.5
(27 września 2024) [±]
Język programowania Java
Licencja GNU LGPL v2.1+
Strona internetowa

LanguageTool – darmowy i otwarty program do sprawdzania gramatyki, stylu i pisowni, którego wszystkie funkcje są dostępne do pobrania[1]. Strona internetowa LanguageTool łączy się z siostrzanym projektem o nazwie LanguageTool Premium (dawniej LanguageTool Plus), który zapewnia ulepszone wykrywanie błędów w języku angielskim i niemieckim, a także łatwiejszą korektę dłuższych tekstów, zgodnie z modelem open-core.

Został on zapoczątkowany przez Daniela Nabera[2] na potrzeby jego pracy dyplomowej w 2003 roku (napisanej wówczas w Pythonie). Obecnie obsługuje 31 języków, z których każdy jest rozwijany przez opiekunów-wolontariuszy, zazwyczaj rodzimych użytkowników danego języka[3]. W oparciu o wzorce wykrywania błędów tworzone są reguły, a następnie testowane dla danego tekstu. Sama aplikacja jest darmowa i open-source i można ją pobrać do użytku offline. Niektóre języki wykorzystują dane „n-gramowe”[4], które są ogromne i wymagają znacznej mocy obliczeniowej i szybkości wejścia/wyjścia, dla niektórych dodatkowych detekcji. W związku z tym LanguageTool jest również oferowany jako usługa internetowa, która przetwarza dane „n-gramów” po stronie serwera. LanguageTool Premium również wykorzystuje n-gramy jako część swojego modelu biznesowego freemium.

Usługa internetowa LanguageTool może być używana za pośrednictwem interfejsu internetowego w przeglądarce internetowej lub za pośrednictwem wyspecjalizowanych wtyczek po stronie klienta dla Microsoft Office, LibreOffice, Apache OpenOffice, Vim, Emacs, Firefox, Thunderbird i Google Chrome.

Technologia

LanguageTool nie sprawdza zdania pod kątem poprawności gramatycznej, ale czy zawiera ono typowe błędy. Dlatego łatwo jest wymyślić niegramatyczne zdania, które LanguageTool nadal zaakceptuje. Wykrywanie błędów udaje się przy użyciu różnych reguł opartych na XML lub napisanych w Javie[5]. Reguły oparte na XML mogą być tworzone za pomocą formularza online[6].

Nowsze rozwiązania opierają się na dużych bibliotekach n-gramów, które oferują sugestie dotyczące poprawy błędnej pisowni za pomocą sztucznych sieci neuronowych[7].

Przypisy

  1. Internetowe narzędzie do sprawdzania gramatyki, stylu i pisowni [online], LanguageTool [dostęp 2024-01-22] (pol.).
  2. Daniel Naber. A Rule-Based Style and Grammar Checker [dostęp 2024-01-22].
  3. LanguageTool – Supported Languages [online], dev.languagetool.org [dostęp 2024-01-22].
  4. Index of /download/ngram-data/ [online], languagetool.org [dostęp 2024-01-22].
  5. Julian Dyke, Steve Shaw (red.), Linux Administration, Berkeley, CA: Apress, 2006, s. 385–400, DOI10.1007/978-1-4302-0214-1_15, ISBN 978-1-4302-0214-1 (ang.).
  6. Utwórz nową regułę programu LanguageTool [online], community.languagetool.org [dostęp 2024-01-22].
  7. SKILL 2018 : Fachwissenschaftlicher Informatik-Kongress, Studierendenkonferenz Informatik, 26.-27. September 2018, Berlin | WorldCat.org [online], search.worldcat.org [dostęp 2024-01-22] (ang.).