|
Автоматический определитель "Guesser.ru"Автоматический определитель "guesser" позволяет по нескольким введенным словам определить язык текста, на котором он написан.
Принцип работы Автоматического определителя языка текста "guesser" предельно прост. Если вы столкнулись с текстом на незнакомом языке, загрузите его в поле автоматического определителя языка. "Guesser" разобьет текст на слова и сравнит со списком ключевых слов из словаря автоматического определителя языка. В определении языка участвуют не все слова, например, алгоритм исключает предлоги, союзы и слова длиной менее четырех символов.
Поиск совпадений слов происходит для следующих языков: азербайджанского, албанского, английского, арабского, армянского, африкаaнса, белорусского, болгарского, боснийского, венгерского, вьетнамского, голландского, греческого, грузинского, датского, иврита, индонезийского, ирландского, испанского, исландского, итальянского, казахского, китайского, киргизского, корейского, латинского, латышского, литовского, македонского, мальтийского, монгольского, немецкого, нидерландского, норвежского, персидского, польского, португальского, русского, румынского, сербского, словацкого, словенского, суахили, тайского, таджикского, турецкого, туркменского, узбекского, украинского, урду, фарси, финского, французского, хинди, хорватского, чешского, черногорского, шведского, эстонского, эсперанто, японского.
Определение языка текста происходит с некоторой ошибкой, которая зависит от особенности языка, уникальности и количества слов загруженного текста. Частота слов в текстах неравномерна. Некоторые слова встречаются в тектах достаточно равномерно (например, предлоги), однако, частота других слов может быть неравномерной даже в пределах одного текста. К тому же, одно и то же слово может иметь варианты, количество которых иногда достигает более сотни. Поэтому результатом автоматического определения языка может являться список наиболее подходящих языков, которые были определены по загруженному тексту. Для правильного определения языка используйте не менее 70-ти символов или десяти слов текста.
Если вас не удовлетворил результат определителя языка, разработанного бюро переводов Flarus, вы можете обратиться к другим сервисам распознавания языка, например:
|
|